内容简介:Miller 是一个类似 sed、awk、cut、join 和 sort 工具,用来处理基于命名索引的数据,注入 CSV 和表格化的 JSON。5.5.0 版本发布了,内容如下: 特性 新的 positional-indexing 功能。此版本中,你可以通过 $[[3...
Miller 是一个类似 sed、awk、cut、join 和 sort 工具,用来处理基于命名索引的数据,注入 CSV 和表格化的 JSON。5.5.0 版本发布了,内容如下:
特性
- 新的 positional-indexing 功能。此版本中,你可以通过 $[[3]] 获取每个记录的第三个字段的名称,并通过 $[[[3]]] 获得其值。这两种方法在赋值语句的左侧或右侧都是可用的,因此你可以更容易地在 DSL 中提前重命名字段
- 有一个新的 capitalize DSL 功能,补充已经存在的 toupper
- 有一个新的 skip-trivial-records,解决 #197。同样还有一个新的 remove-empty-columns,解决 #206,这两种方法对于数据清理用例都很有用
- 尽管 Miller 在内部使用 mmap 来获得大约 20% 的性能提升(相比于不使用 mmap),但这可能会导致读取大文件或太多小文件时出现内存不足的问题。此版本中,Miller 在这些情况下自动避免 mmap。如果你想手动控制这个,仍然可以使用 --mmap 或 --no-mmap
- 新的 --ivar option for the nest verb,补充已经存在的 --evar
- 有一个新的按键保存 urandrange DSL 函数:urandrange(low,high) 与 low+(high-low)*urand() 相同
- 新的 -v option for the cat verb,它将低级别记录结构转储写入标准错误
- 新的按键保护程序 -N option for mlr, --implicit-csv-header --headerless-csv-output
修复
详情见发布说明:
https://github.com/johnkerl/miller/releases/tag/v5.5.0
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
大数据时代
[英] 维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger) / 周涛 / 浙江人民出版社 / 2012-12 / 49.90元
《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。 维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三......一起来看看 《大数据时代》 这本书的介绍吧!