非常急,Excel相关,一个未知分隔符的txt文件,求导入Excel的方法
接到一个非常变态的TXT文档,要从中整理出一个表格。见图。这个数据有一定的规律,一开始我以为文档是PDF转化成TXT的,看着很像,还费劲安装了Acrobat,试图还原,未...
接到一个非常变态的TXT文档,要从中整理出一个表格。见图。
这个数据有一定的规律,一开始我以为文档是PDF转化成TXT的,看着很像,还费劲安装了Acrobat,试图还原,未果。后来琢磨,似乎不像是PDF转成的TXT。
【其实就算是也没找到方法,变成TXT之后怎么样都找不到分隔符了!!】因为PDF转成TXT之后,不管多少列的数据,通通都会变成一列。这个明显还有同一行的。
并且,最关键的是,这个文档里同一类的数据,缩进全部相同。。。
我现在只求能把图中所有圈出来的那一类数据全部找出来,有没有什么方法可以实现?SQL语句?数量庞大,不可能全部手动。。。求帮忙〒_〒
发的比较急,没有表达清楚。
红框圈出来的为同一列数据,我需要直接提取出它们。它们的规律是,每行开头空格数都为5.如果有谁能帮忙编出VBA,或者其他的office软件能使用的表达式,就直接采纳为满意答案了。
谢谢大家的回答。 展开
这个数据有一定的规律,一开始我以为文档是PDF转化成TXT的,看着很像,还费劲安装了Acrobat,试图还原,未果。后来琢磨,似乎不像是PDF转成的TXT。
【其实就算是也没找到方法,变成TXT之后怎么样都找不到分隔符了!!】因为PDF转成TXT之后,不管多少列的数据,通通都会变成一列。这个明显还有同一行的。
并且,最关键的是,这个文档里同一类的数据,缩进全部相同。。。
我现在只求能把图中所有圈出来的那一类数据全部找出来,有没有什么方法可以实现?SQL语句?数量庞大,不可能全部手动。。。求帮忙〒_〒
发的比较急,没有表达清楚。
红框圈出来的为同一列数据,我需要直接提取出它们。它们的规律是,每行开头空格数都为5.如果有谁能帮忙编出VBA,或者其他的office软件能使用的表达式,就直接采纳为满意答案了。
谢谢大家的回答。 展开
6个回答
展开全部
没看懂:
原始文档是什么?一张图片,或者一个PDF文档?不知道诶什么要用到PDF转换。
图示的是转换前的文档还是转换后的文档?
看现有的图示,如果分成几块的话,还是有规律可循的。就是不知道该文档会分成几块(图示是两种规律)
楼主的原话【能把图中所有圈出来的那一类数据全部找出来】,是只抽取出圈出的这一个<项目>的内容,还是要把后面的及下方的数据作为一行记录,列成需要的表格?
具体到你这个文档上的间隔符
理论上是可以确定出每行开头到底是什么间隔符的,也能找到第一个项目后的间隔符的(,比如都是空格,只是数量不同)。建议楼主从这个思路去着手。
或者,截取一些典型的区块复制到文本里附加上来,让大家帮忙看看
原始文档是什么?一张图片,或者一个PDF文档?不知道诶什么要用到PDF转换。
图示的是转换前的文档还是转换后的文档?
看现有的图示,如果分成几块的话,还是有规律可循的。就是不知道该文档会分成几块(图示是两种规律)
楼主的原话【能把图中所有圈出来的那一类数据全部找出来】,是只抽取出圈出的这一个<项目>的内容,还是要把后面的及下方的数据作为一行记录,列成需要的表格?
具体到你这个文档上的间隔符
理论上是可以确定出每行开头到底是什么间隔符的,也能找到第一个项目后的间隔符的(,比如都是空格,只是数量不同)。建议楼主从这个思路去着手。
或者,截取一些典型的区块复制到文本里附加上来,让大家帮忙看看
追问
原始文档就是TXT文档。用到PDF是因为,我以为这个文档出现这种奇葩的排序方式,是从PDF转化过来的。后来又发现不太像。
可能是我表达有问题,我圈出来的,这就是属性相同的同一列数据,假如在正常的Excel里面,他们都应该属于【Software Name】这一列,而在这里,它们被错开了。
追答
不知道你的txt文本是用什么软件打开的。我这样问是因为,NotePad有个“自动换行”的选项,如果被选中了,即使是一行的数据也会因为太长无法在一行中完整显示而被“软回车”。如果排除了这个情况,那么建议你实行一下操作:
1.用Excel读入TXT文档,导入时,选择固定宽度,指定到最大(保证txt中的一行都在A列)
2.把A列中每个单元格中的第六位是空格的全部删掉(可以在B列定义一个字符对应A列的第六位)
许下的就是你要的了
看到追问晚了,不过觉得自己会采取这个方法
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
确实应该把TXT完整提交出来,否则无法判断您的数据规律。
我认为有可能通过正则表达式把您的需要提取出来!EMEDITOR可以用正则,你不妨试试……
我认为有可能通过正则表达式把您的需要提取出来!EMEDITOR可以用正则,你不妨试试……
追问
规律是每行开头空格数为5,这样可以用表达式写出来么?可以再word里面编辑这个表达式么?
追答
看了你的样稿,应该可以。但你的样稿只有个局部,就没法写出合适正则,因为要完整过滤、选择……当然可以 在WORD里编辑,从TXT中选择到的是无格式纯文本
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2013-07-20
展开全部
需要用带正则表达式功能的文本编辑器进行整理后导入excel
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
能不能提供一下相应的txt文档?
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询