问题描述
例如,我有一个.fa
这样的fasta文件,执行HindIII
的限制性酶切
ataaaatactggcaaacagaatccagcagcacatcaaaaagcttatccac
AGTAATTCATTATATCAAAATGCTCCAggccaggcgtggtggcttatgcc
tgtaatcccagcactttgggaggtcgaagtgggcggatcacttgaggtca
aatgtagtaagattatctcagattttaaccgctgtattaaaaaagcttaa
tataatccatgaaaattggaggccaaactaagcttagatacaaacatcta
ggagttggagactagcctggccaacatgatgaaaccccgtctctaataat
aggaaaaggagaggaatgaggttggaaaatagtacacaggaagcttcaac
我正在找到包含大写字母和小写字母的序列aagctt
,然后将字符串分隔为a
和agctt
将每个碎片作为独立的单元进行处理,并计算其长度
fragment 1 from 1 to 39: length 39
ataaaatactggcaaacagaatccagcagcacatcaaaa
fragment 2 from 40 to 193: length 154
agcttatccac
AGTAATTCATTATATCAAAATGCTCCAggccaggcgtggtggcttatgcc
tgtaatcccagcactttgggaggtcgaagtgggcggatcacttgaggtca
aatgtagtaagattatctcagattttaaccgctgtattaaaaa
fragment 3 from 194 to 230: length 37
agcttaa
tataatccatgaaaattggaggccaaacta
fragment 4 from 231 to 341: length 111
agcttagatacaaacatcta
ggagttggagactagcctggccaacatgatgaaaccccgtctctaataat
aggaaaaggagaggaatgaggttggaaaatagtacacagga
fragment 5 from 342 to 350: length 9
agcttcaac
我不一定需要unix / linux命令,只需要此问题的伪代码
我曾尝试使用sed -i 's/AAGCTT/A\'$'\nAGCTT/g'
与a
分隔agctt
和wc -l
来计算长度,但是我无法获得整个片段的长度。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)