MUltiple Sequence Comparison by Log-Expectation (MUSCLE) ist ein Computerprogramm zur Bearbeitung von Alignments bestehend aus Protein- oder Nukleotidsequenzen und ist lizenzfrei zugänglich. Die Methode wurde von Robert C. Edgar in zwei Artikeln 2004 veröffentlicht. Der erste Artikel stellte den Algorithmus zur Erstellung des Alignments vor und wurde in Nucleic Acids Research veröffentlicht.[2] Der zweite Artikel, publiziert in BMC Bioinformatics, drehte sich mehr um die technischen Details.[3]

MUSCLE
Basisdaten

Entwickler Robert C. Edgar
Erscheinungsjahr 2004
Betriebssystem Linux, macOS, Windows
Programmier­sprache C++
Kategorie Alignment
Lizenz gemeinfreie Software[1]
www.drive5.com/muscle

Algorithmus

Bearbeiten

Der MUSCLE Algorithmus wird in drei Abschnitte aufgeteilt: den draft progressive-, den improved progressive- und den refinement-Abschnitt. Im ersten Abschnitt wird ein erstes Konzept des Alignments erstellt, wobei hier Geschwindigkeit im Vordergrund steht. Im zweiten Abschnitt werden Kimura-Distanzen herangezogen, um ein akkurateres Alignment zu erhalten. Im finalen Abschnitt wird das Alignment aus Abschnitt zwei nochmal verfeinert. Nach jedem Abschnitt sind mehrere Alignments verfügbar. In den ersten beiden Abschnitten des Algorithmus werden die Zeitkomplexität und der DSPACE mit O(N2L + NL2) und O(N2 + NL + L2) angegeben. Im finalen Abschnitt wird ein weiterer Term hinzugefügt: O(N3L). MUSCLE wird oft statt Clustal verwendet, da es üblicherweise (aber nicht immer) besseres Alignments liefert. Außerdem ist MUSCLE deutlich schneller in der Erstellung des Alignments, besonders bei größeren Alignments.

Integration

Bearbeiten

MUSCLE ist in verschiedenen Programmen verfügbar, unter anderem in DNASTAR’s Lasergene, Geneious, MacVector, Sequencher, MEGA und in UGENE, als Plug-In. MUSCLE ist auch als Webservice via European Molecular Biology Laboratory (EMBL) und European Bioinformatics Institute (EBI) erreichbar. Die zwei Artikel, die MUSCLE beschreiben, wurden fast 25000 mal zitiert (15. Februar 2018).

Siehe auch

Bearbeiten

Einzelnachweise

Bearbeiten
  1. www.drive5.com. (abgerufen am 13. März 2018).
  2. Robert C. Edgar: MUSCLE: multiple sequence alignment with high accuracy and high throughput. In: Nucleic Acids Research. Band 32, Nr. 5, 2004, ISSN 0305-1048, S. 1792–1797, doi:10.1093/nar/gkh340, PMID 15034147, PMC 390337 (freier Volltext).
  3. Robert C Edgar: MUSCLE: a multiple sequence alignment method with reduced time and space complexity. In: BMC Bioinformatics. Band 5, 19. August 2004, ISSN 1471-2105, S. 113, doi:10.1186/1471-2105-5-113, PMID 15318951, PMC 517706 (freier Volltext).