MSH2 (DNA Mismatch Repair
Protein)
Datum: 03-11-20
Naam: Elise Sugrim
Studentnummer: 1120009
Klas: LM2G
Docent: Kitty Verzijlbergen
, MBO peptide letter: E
MBO plasmide nr: 14
I Achtergrond informatie
Achtergrond
I.1 Peptiden alignen & eiwitsequentie
De verkregen aminozuursequentie is KQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFSTVDIQKN (bijlage 1). Er
is een Protein Blast1 gedaan en bevindt zich in de coderende aminozuursequentie van DNA mismatch
repair protein Msh2 isoform 12. Het accessienummer is NP_000242.12 en het accessienummer van
het mRNA is NM_000251.33.
Er bestaat ook een DNA mismatch repair protein Msh2 isoform 2, maar dit eiwit is niet relevant bij dit
onderzoek.
"MAVQPKETLQLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYT
AHGEDALLAAREVFKTQGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVRQYRVEV
YKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQRQ
VGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQIIQ
RGGILITERKKADFSTKDIYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKF
LELLSDDSNFGQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCK
TPQGQRLVNQWIKQPLMDKNRIEERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAK
KFQRQAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKF
QEMIETTLDMDQVENHEFLVKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPG
KQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKN
KTEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAI
LEKGQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQT
GVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSAT
KDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVN
NLHVTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQY
IGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAE
VIAKNNSFVNEIISRIKVTT"
I.2 Correcte gennaam + cDNA sequentie + ensembl of NCBI transcript ID
of accession nummer
Het gennaam is MSH22. Ook bekend als COCA1; FCC1; hMSH2; HNPCC; HNPCC1 en LCFS2. Het DNA
mismatch repair protein Msh2 isoform 1 ook bekend als Homo sapiens mutS homolog 2 (MSH2),
transcript variant 1. Dit is het cDNA en het CDS is bruin gemarkeerd (bijlage 2). Het accessienummer
is NM_000251.33.
1 gcattttctt caaccaggag gtgaggaggt ttcgacatgg cggtgcagcc gaaggagacg
61 ctgcagttgg agagcgcggc cgaggtcggc ttcgtgcgct tctttcaggg catgccggag
121 aagccgacca ccacagtgcg ccttttcgac cggggcgact tctatacggc gcacggcgag
181 gacgcgctgc tggccgcccg ggaggtgttc aagacccagg gggtgatcaa gtacatgggg
241 ccggcaggag caaagaatct gcagagtgtt gtgcttagta aaatgaattt tgaatctttt
301 gtaaaagatc ttcttctggt tcgtcagtat agagttgaag tttataagaa tagagctgga
361 aataaggcat ccaaggagaa tgattggtat ttggcatata aggcttctcc tggcaatctc
421 tctcagtttg aagacattct ctttggtaac aatgatatgt cagcttccat tggtgttgtg
481 ggtgttaaaa tgtccgcagt tgatggccag agacaggttg gagttgggta tgtggattcc
541 atacagagga aactaggact gtgtgaattc cctgataatg atcagttctc caatcttgag
601 gctctcctca tccagattgg accaaaggaa tgtgttttac ccggaggaga gactgctgga
661 gacatgggga aactgagaca gataattcaa agaggaggaa ttctgatcac agaaagaaaa
721 aaagctgact tttccacaaa agacatttat caggacctca accggttgtt gaaaggcaaa
781 aagggagagc agatgaatag tgctgtattg ccagaaatgg agaatcaggt tgcagtttca
841 tcactgtctg cggtaatcaa gtttttagaa ctcttatcag atgattccaa ctttggacag
901 tttgaactga ctacttttga cttcagccag tatatgaaat tggatattgc agcagtcaga
961 gcccttaacc tttttcaggg ttctgttgaa gataccactg gctctcagtc tctggctgcc
Protein)
Datum: 03-11-20
Naam: Elise Sugrim
Studentnummer: 1120009
Klas: LM2G
Docent: Kitty Verzijlbergen
, MBO peptide letter: E
MBO plasmide nr: 14
I Achtergrond informatie
Achtergrond
I.1 Peptiden alignen & eiwitsequentie
De verkregen aminozuursequentie is KQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFSTVDIQKN (bijlage 1). Er
is een Protein Blast1 gedaan en bevindt zich in de coderende aminozuursequentie van DNA mismatch
repair protein Msh2 isoform 12. Het accessienummer is NP_000242.12 en het accessienummer van
het mRNA is NM_000251.33.
Er bestaat ook een DNA mismatch repair protein Msh2 isoform 2, maar dit eiwit is niet relevant bij dit
onderzoek.
"MAVQPKETLQLESAAEVGFVRFFQGMPEKPTTTVRLFDRGDFYT
AHGEDALLAAREVFKTQGVIKYMGPAGAKNLQSVVLSKMNFESFVKDLLLVRQYRVEV
YKNRAGNKASKENDWYLAYKASPGNLSQFEDILFGNNDMSASIGVVGVKMSAVDGQRQ
VGVGYVDSIQRKLGLCEFPDNDQFSNLEALLIQIGPKECVLPGGETAGDMGKLRQIIQ
RGGILITERKKADFSTKDIYQDLNRLLKGKKGEQMNSAVLPEMENQVAVSSLSAVIKF
LELLSDDSNFGQFELTTFDFSQYMKLDIAAVRALNLFQGSVEDTTGSQSLAALLNKCK
TPQGQRLVNQWIKQPLMDKNRIEERLNLVEAFVEDAELRQTLQEDLLRRFPDLNRLAK
KFQRQAANLQDCYRLYQGINQLPNVIQALEKHEGKHQKLLLAVFVTPLTDLRSDFSKF
QEMIETTLDMDQVENHEFLVKPSFDPNLSELREIMNDLEKKMQSTLISAARDLGLDPG
KQIKLDSSAQFGYYFRVTCKEEKVLRNNKNFSTVDIQKNGVKFTNSKLTSLNEEYTKN
KTEYEEAQDAIVKEIVNISSGYVEPMQTLNDVLAQLDAVVSFAHVSNGAPVPYVRPAI
LEKGQGRIILKASRHACVEVQDEIAFIPNDVYFEKDKQMFHIITGPNMGGKSTYIRQT
GVIVLMAQIGCFVPCESAEVSIVDCILARVGAGDSQLKGVSTFMAEMLETASILRSAT
KDSLIIIDELGRGTSTYDGFGLAWAISEYIATKIGAFCMFATHFHELTALANQIPTVN
NLHVTALTTEETLTMLYQVKKGVCDQSFGIHVAELANFPKHVIECAKQKALELEEFQY
IGESQGYDIMEPAAKKCYLEREQGEKIIQEFLSKVKQMPFTEMSEENITIKLKQLKAE
VIAKNNSFVNEIISRIKVTT"
I.2 Correcte gennaam + cDNA sequentie + ensembl of NCBI transcript ID
of accession nummer
Het gennaam is MSH22. Ook bekend als COCA1; FCC1; hMSH2; HNPCC; HNPCC1 en LCFS2. Het DNA
mismatch repair protein Msh2 isoform 1 ook bekend als Homo sapiens mutS homolog 2 (MSH2),
transcript variant 1. Dit is het cDNA en het CDS is bruin gemarkeerd (bijlage 2). Het accessienummer
is NM_000251.33.
1 gcattttctt caaccaggag gtgaggaggt ttcgacatgg cggtgcagcc gaaggagacg
61 ctgcagttgg agagcgcggc cgaggtcggc ttcgtgcgct tctttcaggg catgccggag
121 aagccgacca ccacagtgcg ccttttcgac cggggcgact tctatacggc gcacggcgag
181 gacgcgctgc tggccgcccg ggaggtgttc aagacccagg gggtgatcaa gtacatgggg
241 ccggcaggag caaagaatct gcagagtgtt gtgcttagta aaatgaattt tgaatctttt
301 gtaaaagatc ttcttctggt tcgtcagtat agagttgaag tttataagaa tagagctgga
361 aataaggcat ccaaggagaa tgattggtat ttggcatata aggcttctcc tggcaatctc
421 tctcagtttg aagacattct ctttggtaac aatgatatgt cagcttccat tggtgttgtg
481 ggtgttaaaa tgtccgcagt tgatggccag agacaggttg gagttgggta tgtggattcc
541 atacagagga aactaggact gtgtgaattc cctgataatg atcagttctc caatcttgag
601 gctctcctca tccagattgg accaaaggaa tgtgttttac ccggaggaga gactgctgga
661 gacatgggga aactgagaca gataattcaa agaggaggaa ttctgatcac agaaagaaaa
721 aaagctgact tttccacaaa agacatttat caggacctca accggttgtt gaaaggcaaa
781 aagggagagc agatgaatag tgctgtattg ccagaaatgg agaatcaggt tgcagtttca
841 tcactgtctg cggtaatcaa gtttttagaa ctcttatcag atgattccaa ctttggacag
901 tttgaactga ctacttttga cttcagccag tatatgaaat tggatattgc agcagtcaga
961 gcccttaacc tttttcaggg ttctgttgaa gataccactg gctctcagtc tctggctgcc