python – 可变长度的numpy recarray字符串

栏目: Python · 发布时间: 6年前

内容简介:http://stackoverflow.com/questions/9108837/numpy-recarray-strings-of-variable-length

是否可以初始化一个可以保持字符串的numpy recarray,而不知道字符串的长度呢?

作为(设计)的例子:

mydf = np.empty( (numrows,), dtype=[ ('file_name','STRING'), ('file_size_MB',float) ] )

问题是我正在使用信息填充我的重组,而且我不一定需要事先知道file_name的最大长度.

我所有的尝试导致字符串字段被截断:

>>> mydf = np.empty( (2,), dtype=[('file_name',str),('file_size_mb',float)] )
>>> mydf['file_name'][0]='foobarasdf.tif'
>>> mydf['file_name'][1]='arghtidlsarbda.jpg'
>>> mydf
array([('', 6.9164002347457e-310), ('', 9.9413127e-317)], 
      dtype=[('file_name', 'S'), ('file_size_mb', '<f8')])
>>> mydf['file_name']
array(['f', 'a'], 
      dtype='|S1')

(除此之外,mydf [‘file_name’]为什么显示’f’和’a’,而mydf显示”和”?

类似地,如果我用type(say)| S10为file_name初始化,那么事情将被截断为10.

我可以找到的唯一类似的问题是 this one ,但是这是先验计算适当的字符串长度,因此与我不一样(因为我事先知之甚少).

除了使用(例如)| S9999999999999(即一些可笑的上限)启动file_name,还有其他替代方法?

而不是使用STRING dtype,可以随时使用对象作为dtype.这将允许将任何对象分配给数组元素,包括 Python 变长字符串.例如:

>>> import numpy as np
>>> mydf = np.empty( (2,), dtype=[('file_name',object),('file_size_mb',float)] )
>>> mydf['file_name'][0]='foobarasdf.tif'
>>> mydf['file_name'][1]='arghtidlsarbda.jpg'
>>> mydf
array([('foobarasdf.tif', 0.0), ('arghtidlsarbda.jpg', 0.0)], 
      dtype=[('file_name', '|O8'), ('file_size_mb', '<f8')])

这是一个反对数组概念的精神,以具有可变长度的元素,但这是一个接近可以得到.数组的想法是元素存储在存储器中,这些存储器地址明确定义和间隔开,这些地址禁止可变长度的元素.通过将指针存储到数组中的字符串,可以规避此限制. (这基本上是上面的例子.)

http://stackoverflow.com/questions/9108837/numpy-recarray-strings-of-variable-length


以上所述就是小编给大家介绍的《python – 可变长度的numpy recarray字符串》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Mastering Regular Expressions, Second Edition

Mastering Regular Expressions, Second Edition

Jeffrey E F Friedl / O'Reilly Media / 2002-07-15 / USD 39.95

Regular expressions are an extremely powerful tool for manipulating text and data. They have spread like wildfire in recent years, now offered as standard features in Perl, Java, VB.NET and C# (and an......一起来看看 《Mastering Regular Expressions, Second Edition》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换