用perl写一个关于两个文件对比的程序
老板非要写个perl程序处理两个文件,愁死了啊。请各位大侠帮帮忙。有两个文件fileAchr11111ATchr22222GCchr33333GAchr44444ACfi...
老板非要写个perl程序处理两个文件,愁死了啊。
请各位大侠帮帮忙。
有两个文件 fileA
chr1 1111 A T
chr2 2222 G C
chr3 3333 G A
chr4 4444 A C
fileB:
chr1 1111 A T
chr2 2222 G A
chr3 3333 G A
chr4 5555 A C
程序需要实现的功能是 比较文件第二列,若相同则判断第三列和第四列,若也相同则将第二列第三列第四列的内容输入到文件A中;
若第四列不同则将fileA的第二列第三列第四列的内容输入到文件A1中,将fileB的第二列第三列第四列的内容输入到文件B1中;
若第二列不同则将fileA的第二列第三列第四列的内容输入到文件A2中,将fileB的第二列第三列第四列的内容输入到文件B2中;
真的跪求大侠能给一个完整的程序,万分感激。。。。
如第二列相同则比较此行的第三列和第四列。比如在上述例子fileA和fileB,我想得到的结果是:
文件A:chr3 3333 G A
文件A1:chr2 2222 G C
文件B1:chr2 2222 G A
文件A2:chr4 4444 A C
文件B2:chr4 5555 A C 展开
请各位大侠帮帮忙。
有两个文件 fileA
chr1 1111 A T
chr2 2222 G C
chr3 3333 G A
chr4 4444 A C
fileB:
chr1 1111 A T
chr2 2222 G A
chr3 3333 G A
chr4 5555 A C
程序需要实现的功能是 比较文件第二列,若相同则判断第三列和第四列,若也相同则将第二列第三列第四列的内容输入到文件A中;
若第四列不同则将fileA的第二列第三列第四列的内容输入到文件A1中,将fileB的第二列第三列第四列的内容输入到文件B1中;
若第二列不同则将fileA的第二列第三列第四列的内容输入到文件A2中,将fileB的第二列第三列第四列的内容输入到文件B2中;
真的跪求大侠能给一个完整的程序,万分感激。。。。
如第二列相同则比较此行的第三列和第四列。比如在上述例子fileA和fileB,我想得到的结果是:
文件A:chr3 3333 G A
文件A1:chr2 2222 G C
文件B1:chr2 2222 G A
文件A2:chr4 4444 A C
文件B2:chr4 5555 A C 展开
4个回答
展开全部
给钱发工资么……
不考虑内存大小和文件大小的话,直接把A全读到内存做一个hash
然后一行一行读B不就可以比较了,比较的逻辑也有了……,就想直接求程序么……
不考虑内存大小和文件大小的话,直接把A全读到内存做一个hash
然后一行一行读B不就可以比较了,比较的逻辑也有了……,就想直接求程序么……
追问
是呢,我也想到用哈希,但是我perl实在是没接触过,程序又要得急,所以求程序呢,拜托啦~~~~
追答
#!/usr/bin/perl
use strict;
use warnings;
open FH,"fileA.txt" || die $!;
my %hash = ();
while(){
my @arr = split;
$hash{$arr[0]} = \@arr;
}
close FH;
open FH2,"fileB.txt" || die $!;
open FHA,">A" || die $!;
open FHA1,">A1" || die $!;
open FHB1,">B1" || die $!;
open FHA2,">A2" || die $!;
open FHB2,">B2" || die $!;
while(){
my @arr = split;
my @arrA = @{$hash{$arr[0]}};
if($arr[1] eq $arrA[1]){
if($arr[3] ne $arrA[3]){
print FHA1 join("\t", @arrA),"\n";
print FHB1 join("\t", @arr),"\n";
}elsif($arr[2] eq $arrA[2]){
print "@arr\n";
print FHA join("\t", @arrA),"\n";
}
}else{
print FHA2 join("\t", @arrA),"\n";
print FHB2 join("\t", @arr),"\n";
}
}
close FH2;
close FHA;
close FHA1;
close FHB1;
close FHA2;
close FHB2;
#代码写的有些丑陋,将就着用吧,有分就给补点分吧
展开全部
用hash会打乱列内容的顺序哦
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
第一列那个chr1是什么东西,还有文件A是不是少了一行,第一行的东西不也是都相同的吗?程序应该是不难编的,我想先把需求问清楚
追问
对呢,第一行的东西也是放在A文件中,我给忽略了,不好意思呀~谢谢大侠~~
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
这个问题很简单的 你建一个hash结构就可以了 $ha{chr3}{1111} -> [$i],判断fileB中时候存在(exist $ha{}{})就可以了
追问
能具体点儿么?我真是perl盲。。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询