问题内容
我是 spark 新手。我试图展平数据框,但未能通过“爆炸”做到这一点。
原始数据框架构如下:
id|approvaljson
1|[{"approvertype":"1st line manager","status":"approved"},{"approvertype":"2nd line manager","status":"approved"}]
2|[{"approvertype":"1st line manager","status":"approved"},{"approvertype":"2nd line manager","status":"rejected"}]
我需要将其转换为以下架构?
id|approvaltype|status
1|1st line manager|approved
1|2nd line manager|approved
2|1st line manager|approved
2|2nd line manager|rejected
我已经尝试过
df_exploded = df.withcolumn("approvaljson", explode("approvaljson"))
但是我得到了错误:
Cannot resolve "explode(ApprovalJSON)" due to data type mismatch:
parameter 1 requires ("ARRAY" or "MAP") type, however, "ApprovalJSON"
is of "STRING" type.;
正确答案
首先将类似 json 的字符串解析为结构数组,然后使用 inline
将数组分解为行和列
df1 = df.withcolumn("approvaljson", f.from_json("approvaljson", schema="array>"))
df1 = df1.select("id", f.inline('approvaljson'))
结果
df1.show()
+---+----------------+--------+
| ID| ApproverType| Status|
+---+----------------+--------+
| 1|1st Line Manager|Approved|
| 1|2nd Line Manager|Approved|
| 2|1st Line Manager|Approved|
| 2|2nd Line Manager|Rejected|
+---+----------------+--------+
以上就是无法分解 Spark 数据框中的嵌套 JSON的详细内容,更多请关注编程网其它相关文章!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
软考中级精品资料免费领
- 历年真题答案解析
- 备考技巧名师总结
- 高频考点精准押题
- 资料下载
- 历年真题
193.9 KB下载数265
191.63 KB下载数245
143.91 KB下载数1142
183.71 KB下载数642
644.84 KB下载数2755
相关文章
发现更多好内容猜你喜欢
AI推送时光机无法分解 Spark 数据框中的嵌套 JSON
后端开发2024-02-11
PHP无法解析嵌套的JSON数据如何解决
后端开发2023-07-05
Python如何取json中的嵌套数据
后端开发2023-09-25
Java多层嵌套JSON类型数据的方法
后端开发2023-06-29
解码/解组复杂的嵌套 JSON 数据结构
后端开发2024-02-10
Android解析JSON数据的方法分析
后端开发2022-06-06
解决PHP无法返回JSON数据的几种方法
后端开发2024-03-12
关于MySQL嵌套子查询中无法关联主表字段问题的解决方法
后端开发2022-12-26
关于 MySQL 嵌套子查询中无法关联主表字段问题的解决方法
后端开发2022-12-26
java多次嵌套循环查询数据库导致代码中数据处理慢的解决
后端开发2023-03-15
PHP接口无法返回JSON格式数据的解决方案
后端开发2024-03-12
Android项目中实现解析JSON数据的方法
后端开发2023-05-31
解决PHP中JSON数据中文乱码问题的方法
后端开发2024-03-09
Android中使用Gson解析JSON数据的两种方法
后端开发2022-06-06
Python中json格式数据的编码与解码方法详解
后端开发2022-06-04
MyBatis实现两种查询树形数据的方法详解(嵌套结果集和递归查询)
后端开发2024-04-02
php数据库无法插入中文的解决方法
后端开发2023-06-20
咦!没有更多了?去看看其它编程学习网 内容吧