perl 是否有比split函数更高效的拆分数据的方法?
使用perl读取一个1千万记录的数据..数据使用"|"分隔.78351186|2011-02-1512:24:19|2037-01-0100:00:00|78351186...
使用perl 读取一个1千万记录的数据.. 数据使用 "|" 分隔.
78351186|2011-02-15 12:24:19|2037-01-01 00:00:00|78351186|0|0|
我需要分别对 记录的 第1 和第四个字段进行处理.
我看到很多人在处理中都要使用split这个函数.把数据分割成数组重新存起来.
但是使用split的效率不是很理想, 使用split之后 ..脚本的执行时间增大了12倍..
请问 是否有比split 更好的方法了? 求高手指点.... 展开
78351186|2011-02-15 12:24:19|2037-01-01 00:00:00|78351186|0|0|
我需要分别对 记录的 第1 和第四个字段进行处理.
我看到很多人在处理中都要使用split这个函数.把数据分割成数组重新存起来.
但是使用split的效率不是很理想, 使用split之后 ..脚本的执行时间增大了12倍..
请问 是否有比split 更好的方法了? 求高手指点.... 展开
2个回答
展开全部
perl只有split一个函数分割字符串,没有完成同样功能的其它函数了。split因为要使用正则,要启动正则引擎,开销当然要大一点。
如果想加快速度,只有自己用index搜索|,然后用substr获取指定的字段,自己编程循环搜索来代替split的功能,理论上效率要提高一点,但是能提高多少只有你自己实践了才知道。
如果想加快速度,只有自己用index搜索|,然后用substr获取指定的字段,自己编程循环搜索来代替split的功能,理论上效率要提高一点,但是能提高多少只有你自己实践了才知道。
更多追问追答
追问
我测试了一下用.index搜索.效率也不高. index好像不能指定.第几次搜索的结果吧..比如.我要找第5个字段..那就要搜索 | 五次.才能找到第五个字段的位置.. 这样的循环效率也不高..
追答
是的,需要不断循环,所以效率和使用正则相比,提高可能不太明显。
但是,即使用汇编、用C语言,也只能这样搜索,使用FOR循环一次性搜索出需要的所有字段,效率上可能再提高一点点。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询