python – 可变长度的numpy recarray字符串

栏目: Python · 发布时间: 5年前

内容简介:http://stackoverflow.com/questions/9108837/numpy-recarray-strings-of-variable-length

是否可以初始化一个可以保持字符串的numpy recarray,而不知道字符串的长度呢?

作为(设计)的例子:

mydf = np.empty( (numrows,), dtype=[ ('file_name','STRING'), ('file_size_MB',float) ] )

问题是我正在使用信息填充我的重组,而且我不一定需要事先知道file_name的最大长度.

我所有的尝试导致字符串字段被截断:

>>> mydf = np.empty( (2,), dtype=[('file_name',str),('file_size_mb',float)] )
>>> mydf['file_name'][0]='foobarasdf.tif'
>>> mydf['file_name'][1]='arghtidlsarbda.jpg'
>>> mydf
array([('', 6.9164002347457e-310), ('', 9.9413127e-317)], 
      dtype=[('file_name', 'S'), ('file_size_mb', '<f8')])
>>> mydf['file_name']
array(['f', 'a'], 
      dtype='|S1')

(除此之外,mydf [‘file_name’]为什么显示’f’和’a’,而mydf显示”和”?

类似地,如果我用type(say)| S10为file_name初始化,那么事情将被截断为10.

我可以找到的唯一类似的问题是 this one ,但是这是先验计算适当的字符串长度,因此与我不一样(因为我事先知之甚少).

除了使用(例如)| S9999999999999(即一些可笑的上限)启动file_name,还有其他替代方法?

而不是使用STRING dtype,可以随时使用对象作为dtype.这将允许将任何对象分配给数组元素,包括 Python 变长字符串.例如:

>>> import numpy as np
>>> mydf = np.empty( (2,), dtype=[('file_name',object),('file_size_mb',float)] )
>>> mydf['file_name'][0]='foobarasdf.tif'
>>> mydf['file_name'][1]='arghtidlsarbda.jpg'
>>> mydf
array([('foobarasdf.tif', 0.0), ('arghtidlsarbda.jpg', 0.0)], 
      dtype=[('file_name', '|O8'), ('file_size_mb', '<f8')])

这是一个反对数组概念的精神,以具有可变长度的元素,但这是一个接近可以得到.数组的想法是元素存储在存储器中,这些存储器地址明确定义和间隔开,这些地址禁止可变长度的元素.通过将指针存储到数组中的字符串,可以规避此限制. (这基本上是上面的例子.)

http://stackoverflow.com/questions/9108837/numpy-recarray-strings-of-variable-length


以上所述就是小编给大家介绍的《python – 可变长度的numpy recarray字符串》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

互联网时代

互联网时代

《互联网时代》主创团队 / 北京联合出版公司 / 2015-2-1 / 49.80元

【编辑推荐】 1、人类正进入一个充满未知的时代,《互联网时代》不仅告诉你现在,还告诉你未来。 2、中央电视台《互联网时代》是全球第一部全面、系统、深入、客观解析互联网的纪录片,同名图书容量巨大,除纪录片内容,更包含大量尚未播出的内容。 3、中央电视台继《大国崛起》《公司的力量》《华尔街》等之后的又一重磅力作。10个摄影组,制作近3年,在全球14个国家和地区拍摄,6位“互联网之父”......一起来看看 《互联网时代》 这本书的介绍吧!

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

SHA 加密
SHA 加密

SHA 加密工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换