我有一个txt文档(200MB),希望删除文档中所有行中"_"字符之后的所有内容,怎么办?

[复制链接]
查看11 | 回复3 | 2011-5-8 09:55:43 | 显示全部楼层 |阅读模式
文档中内容的格式大致为:
“>IMGA|6g025040.1_Unknown_Protein_AHRD_V1_chr06

gttgtcataaaagttgtaccaaataadfsdf”
我想删除第一行中“_”字符后的所有内容。文档中这样的行很多,我不能手动删除。

回复

使用道具 举报

千问 | 2011-5-8 09:55:43 | 显示全部楼层
用Word即可处理,无需别的什么软件。用Word打开文件后,按Ctrl+H组合键调出替换对话框,在查找中输入:_*^13在替换为中输入:^p勾选使用通配符,再点“全部替换”,保存文件,提示会丢失格式时,不用理会,确定即可。
回复

使用道具 举报

千问 | 2011-5-8 09:55:43 | 显示全部楼层
不知道是你复制的原因还是什么,你上面内容是两行的,你先确认一下,如果确实是一行,用editplus打开这个文件,Ctrl+h替换,选中正则表达式,查找内容处填_.*替换处留空,全部替换就行了。
回复

使用道具 举报

千问 | 2011-5-8 09:55:43 | 显示全部楼层
帮我想想一个程序,在。TXT的文本文档里,删除满足要求的一行,要能用如果用Java的话,有正则表达式可以用。如果用C的话,可以考虑自己写匹配算法
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行