Files
biopython/Tests/NBRF/clustalw.pir
chapmanb eb65c38f54 Fix NBRF/PIR parsing so that is accepts files produced by Clustalw -- thanks to Ashleigh Smythe for the bug report.
Fix bugs in NBRF parsing where not all of the comments were passed through.
Try to speed up sequence building using joins instead of sequential addition of sequence.
2004-03-02 23:17:13 +00:00

109 lines
5.1 KiB
Plaintext

>DL;804Angiostrongylus_cantonensis
--------------------------------------------------
----------------------------------ATT-AAGCCATG-CA-
T-GAG-GA--GTTC-A--GC------TT--TA-A----G-T-GA--AA-C
-TGCGAACGGCTCATTAG-AGCAGATG-T-GATT---TATT-CG--G--A
A-A--A-T--CC-T----ATT-GGA--TAACTGCG--GTAAT-TCTGGAG
CTAATACATGCGTAT-A-A-AC-CCTG-AC---T--T-T--C---GAAA-
-GGGTGCAAT-TA-TTAGAG---C---AA-A-TCAAT-CAT---------
----T-T---TC----------G-GA------TG----TAGTT-------
---T---GCT---G-A-C-TC-TGAATA-A---CG--CAG--CATA-TCG
G-CGGC-T-T-GT---TCGCCGATAAT-CCGAAAA----AG---TGT-C-
TGCCC-TATCA--AC---CT---GA-TGGTAGTCTATTAGTCTA-CCATG
GTTATTACGGGTAACGGAGAATAAGGGTT-CGACTCCGGAGAGGGAGCCT
TAGAAACGGCTACCACATCCAAGGAAGGCAGCAG-GCGCGAAACTTATCC
AA-T-CTTG-----A-ATAGATGA-GATAGTGACT---------------
--------AAAAATAAAAA--GACCA---TTCC-T-AT-G--GAACG-GT
TATTTCAATGAGT--TGATCATAAACCTTTTTT--C-G-AGTA--TCCAG
TGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTC--CACTA
GTGTA-AATCGTCATTGCTGCGGTTAAAAAGC-TCGTAGTTGGAT-C-TG
AGTTGC---AT--GCA-AT-G-ATTCG--C-CT----T--TG--G--CGT
----TAAT------C---AT-TG-TTGTG---ACTA---T------T-T-
--G--CTG--G-T-T--TTCT-AT--TG-A--AA-----TTTC-----G-
A-TT-----TCTTTA-GTG-GC-TA--GCGA-GTT-TA-CTTTGA-AT-A
AATTAAAGTGCT-CAGAACAAG---CGTT-----T--GC-TT-G--AAT-
G-GTCGAT-CATGGAATAA-----TAAAAGAGGAC--TTCG---GT-T--
----CTATT-T----ATTGGTTC-AG---G-AA------CTG------AA
GT-AATGATTAAGAGGGACA--ATTC-GGGGGCATTCGTATCCCTGCGCG
AGAGGTGAAATTCGTG-GACCG-CAGGGGGACGCCCTAAAGCGAAAG-CA
TTTGCC-AAGAAT--GTCTTCATTAATCA-AGAACGAAAGTCAGAGGTTC
GAAGGCGATTAGATA--CCGCCC-TAGTTCTGACCGTAAACTATGCCATC
TAGC-GA--TCC-GAT--GG-GG--TA--T--TG--T-T----GCCTT--
GTCGAGG-AGCTT-CCCGGAAACGA--AA-GTCTTTCGGT-TCCTGGGGT
AGTATGGTTGC-AAAGCT-G-AAACTTAAAGA-AATTGACGGAATGGCAC
CACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGA--AAACT
-CACCC-GGCCCGGACACCGTAA-GGATTGAC-----AGATTGA--A---
AGCTCTTTCTC-GATTTGGTGGTTGGTGGTGCATGGCCGTTCTTAGTTG-
GTGGAG-CGATTTGTCTGGTTTATTCC-GAT-AACGAGCGAGACTCT-AG
-C-C--TG-CTAAA-TA-G--TGA--CTA---------------GA----
TT-----------AT------T----GAGTC-------TA-G----T--C
-------TA-------------C-TT-----CTT-AG---AGGGATAAG-
CGG---TGTT-T-----A-G-C--CGCA--CG-AGATTGAGCGATAACAG
GTCTGTGATGCCCTTAGATGTCCGGGG-CTG-CACGCGCGCTACAATGGA
AG-AAT-CAGC--TGGC---CTA--T----CCAT-TGC-CG-A-AAGGT-
AT----T----GGTAAACCG-TTGAAACT--CTTCC-GTG-ACCGGGATA
GGGAATTGT--A-ATT---------ATT---TCCC-TTGAACG-AGGAAT
TCCTAGTAAGTGTG-AGTCATCAGCTCACGCTGATTACGTCCC-TGCCAT
TTGTACACACCGCCCGTCGCTGTC-CGGG-ACTG--AGC-TGTC--TCGA
GAGGACT-GCGG-A-CTA----CT--GTA----TTGA-GG---CCT----
---T---CGGG------TCG-----CGATA----TGGCG---GG-AAA-C
AG-TTC-AATC-G-CAATG-G--CTTGAACCGGGTAAAAGTCGT-AACAA
GGTATCTG------------------------------------------
---------------------------
*
>DL;815Parelaphostrongylus_odocoil
--------------------------------------------------
----------------------------------ATT-AAGCCATG-CA-
T-GTG-GA--GTTC-A--AC------TT--CA-A---AG-T-GA--AA-C
-TGCGAACGGCTCATTAG-AGCAGATG-T-CATT---TATT-CG--G--A
A-A--A-T--CC-T--T-AAT-GGA--TAACTGCG--GTAAT-TCTGGAG
CTAATACATATGCAT-A-A-AC-CCTG-AC---T--C-TG-T---GAAA-
-GGGTGCAAT-TA-TTAGAG---C---AA-A-TCAAT-CAT---------
----T-T---TC----------G-GA------TG----TAGTT-------
---T---GCT---G-A-C-TC-TGAATA-A---CG--CAG--CATA-TCG
G-CGGC-T-T-GT---TCGCCGATATT-CCGAAAA----AG---TGT-C-
TGCCC-TATCA--AC---CT---GA-TGGTAGTCTATTAGTCTA-CCATG
GTTATTACGGGTAACGGAGAATAAGGGTT-CGACTCCGGAGAGGGAGCCT
TAGAAACGGCTACCACATCCAAGGAAGGCAGCAG-GCGCGAAACTTATCC
AA-T-CTTG-----A-ATAGATGA-GATAGTGACT---------------
--------AAAAATAAAAA--GACCA---TTCC-T-AT-G--GAACG-GT
CATTTCAATGAGT--TGATCATAAACCTTTTTT--C-G-AGTA--TCAAG
TGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTC--CACTA
GTGTA-AATCGTCATTGCTGCGGTTAAAAAGC-TCGTAGTTGGAT-C-TG
AGTCGC---AT--GCA-AT-G-ATTCG--C-CT----T--TG--G--CGT
----TAAT------C---AT-TG-TTGTG---ACTA---T------T-T-
--G--CTG--G-T-T--TTCT-AT--TG-A--AA-----TTTC-----G-
A-TT-----TCTATA-GTG-GC-TA--GCGA-GTT-TA-CTTTGA-AT-A
AATTAAAGTGCT-CAGAACAAG---CGTT-----T--GC-TT-G--AAT-
G-GTCGAT-CATGGAATAA-----TAAAAGAGGAC--TTCG---GT-T--
----CTATT-T----ATTGGTTC-AG---G-AA------CTG------AA
AT-AATGGTTAAGAGGGACA--ATTC-GGGGGCATTCGTATCCCTGCGCG
AGAGGTGAAATTCGTG-GACCG-CAGGGGGACGCCCTAAAGCGAAAG-CA
TTTGCC-AAGAAT--GTCTTCATTAATCA-AGAACGAAAGTCAGAGGTTC
GAAGGCGATTAGATA--CCGCCC-TAGTTCTGACCGTAAACTATGCCATC
TAGC-GA--TCC-GAT--GG-GG--TA--T--TG--T-T----GCCTT--
GTCGAGG-AGCTT-CCCGGAAACGA--AA-GTCTTTCGGT-TCCTGGGGT
AGTATGGTTGC-AAAGCT-G-AAACTTAAAGA-AATTGACGGAATGGCAC
CACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGA--AAACT
-CACCC-GGCCCGGACACCGTAA-GGATTGAC-----AGATTGA--A---
AGCTCTTTCTC-GATTTGGTGGTTGGTGGTGCATGGCCGTTCTTAGTTG-
GTGGAG-CGATTTGTCTGGTTTATTCC-GAT-AACGAGCGAGACTCT-AG
-C-C--TG-CTAAA-TA-G--TGA--CTA---------------GA----
T------------ACG-----T----ATGTC-------TA-G----T--C
-------TA-------------C-TT-----CTT-AG---AGGGATAAG-
CGG---TGTT-T-----A-G-C--CGCA--CG-AGATTGAGCGATAACAG
GTCTGTGATGCCCTTAGATGTTCGGGG-CTG-CACGCGCGCTACAATGGA
AG-AAT-CAGC--TGGC---CTA--T----CCAT-TAC-CG-A-AAGGT-
AT----T----GGTAAACCG-TTGAAACT--CTTCC-GTG-ACCGGGATA
GGGAATTGT--A-ATT---------ATT---TCCC-TTGAACG-AGGAAT
TCCTAGTAAGTGTG-AGTCATCAGCTCACGCTGATTACGTCCC-TGCCAT
TTGTACACACCGCCCGTCGCTGTC-CGGG-ACTG--AGC-TGTC--TCGA
GAGGACT-GCGG-A-CTA----CT--GTA----TTGA-GG---CCT----
---T---CGGG------TCG-----CGATA----TGGCG---GG-AAA-C
AG-TTC-AATC-G-CAATG-G--CTTGAACCGGGTAAAAGTCGT-A----
--------------------------------------------------
---------------------------
*