Was ist der Unterschied zwischen FASTA und FASTQ

Inhaltsverzeichnis:

Was ist der Unterschied zwischen FASTA und FASTQ
Was ist der Unterschied zwischen FASTA und FASTQ

Video: Was ist der Unterschied zwischen FASTA und FASTQ

Video: Was ist der Unterschied zwischen FASTA und FASTQ
Video: Difference between FASTA and FASTQ file formats. How to make a fasta formatted file. 2024, Juli
Anonim

Der Hauptunterschied zwischen FASTA und FASTQ besteht darin, dass FASTA ein textbasiertes Format ist, das nur Nukleotid- oder Proteinsequenzen speichert, während FASTQ ein textbasiertes Format ist, das sowohl Sequenz- als auch zugehörige Sequenzqualitätswerte speichert.

Bioinformatik ist ein Bereich, der unterschiedliche Software verwendet, um biologische Daten zu analysieren und zu verstehen, insbesondere wenn der Datensatz komplex und groß ist. Dieses Feld kombiniert Biologie, Chemie, Physik, Informatik, Informationstechnik, Mathematik und Statistik, um biologische Daten zu analysieren und zu interpretieren. FASTA und FASTQ sind zwei Sequenzdarstellungsformate im Bereich der Bioinformatik, um Sequenzen auszurichten und zu analysieren. Tatsächlich ist FASTQ ein Sequenzdateiformat, das das FASTA-Format um die Fähigkeit erweitert, die Sequenzqualität zu speichern.

Was ist FASTA?

FASTA ist eine Alignment-Software für DNA- und Proteinsequenzen. Die FASTA-Software verwendet das FASTA-Format. Es ist ein textbasiertes Format, das entweder Nukleotidsequenzen oder Aminosäuresequenzen (Proteinsequenzen) darstellt. Hier repräsentieren einzelne Buchstabencodes diese beiden Sequenzen. FASTA ist ein wichtiges Werkzeug in den Bereichen Bioinformatik und Biochemie. Bei diesem Format können Sequenznamen und Kommentare den Sequenzen vorangestellt werden.

FASTA vs. FASTQ in tabellarischer Form
FASTA vs. FASTQ in tabellarischer Form

Abbildung 01: FASTA-Sequenz

Dieses Format stammt aus der FASTA-Software und wurde 1985 von David J. Lipmann und William R. Pearson eingeführt. Das FASTA-Tool wurde im Laufe der Zeit vielfach modifiziert, und die neueste Version besteht aus Programmen für Protein:Protein, DNA:DNA, Protein:translatierte DNA (mit Rasterverschiebungen) und geordnete oder ungeordnete Peptidsuchen. FASTA liest eine bestimmte Nukleotid- oder Aminosäuresequenz und sucht nach der entsprechenden Sequenzdatenbank, indem es lokales Sequenz-Alignment verwendet, um Übereinstimmungen ähnlicher Datenbanksequenzen zu finden.

Was ist FASTQ?

FASTQ ist eine im Bereich der Bioinformatik verwendete Alignment-Software, die sowohl eine biologische Sequenz (normalerweise Nukleotidsequenz) als auch die entsprechenden Qualitätswerte speichert. FASTQ wurde ursprünglich entwickelt, um eine FASTA-formatierte Sequenz und die zugehörigen Qualitätsdaten vom Wellcome Trust Sanger Institute zu bündeln. Mit der Entwicklung auf dem Gebiet der Bioinformatik wurde FASTQ zum De-facto-Standard für die Speicherung der Ergebnisse vieler Hochdurchsatz-Sequenzierungsgeräte.

Das FASTQ-Format verwendet vier verschiedene Zeilen pro Sequenz. Zeile 1 beginnt mit dem Zeichen @ und wird von einer Sequenzkennung gefolgt (ähnlich einer FASTA-Titelzeile). Zeile 2 besteht aus Rohbuchstaben. In Zeile 3 beginnt die Sequenz mit einem „+“-Zeichen, dem optional dieselbe Sequenzkennung folgt. Zeile 4 codiert die Qualitätswerte für die Folge in Zeile 2 und sollte aus der gleichen Anzahl von Symbolen bestehen wie Buchstaben in der Folge.

Was sind die Ähnlichkeiten zwischen FASTA und FASTQ?

  • FASTA und FASTQ sind Ausrichtungswerkzeuge.
  • Das sind zwei Sequenzdarstellungsformate.
  • Beide haben einen Bezug zur Bioinformatik.
  • Sowohl FAST als auch FASTQ sind wichtige Tools für Speicher- und Sequenzierungszwecke.
  • FASTQ ist eine Erweiterung des FASTA-Formats mit der Möglichkeit, die Sequenzqualität zu speichern.

Was ist der Unterschied zwischen FASTA und FASTQ?

FASTA ist ein textbasiertes Format, das nur Nukleotid- oder Proteinsequenzen speichert, während FASTQ ein textbasiertes Format ist, das sowohl Sequenz- als auch zugehörige Sequenzqualitätswerte speichert. Dies ist also der Hauptunterschied zwischen FASTA und FASTQ. Darüber hinaus speichert FASTA Sequenzfragmente nach dem Mapping, während FASTQ Sequenzfragmente vor dem Mapping speichert. Außerdem besteht ein weiterer Unterschied zwischen FASTA und FASTQ darin, dass FASTA aus einer Beschreibungszeile und FASTAQ aus vier Zeilen besteht.

Die folgende Infografik zeigt die Unterschiede zwischen FASTA und FASTQ in tabellarischer Form für einen direkten Vergleich.

Zusammenfassung – FASTA vs. FASTQ

Bioinformatik verwendet verschiedene Formate von Sequenzen wie FASTA und FASTQ usw. FASTA speichert Sequenzfragmente nach der Kartierung, während FASTQ die Sequenzfragmente vor der Kartierung speichert. FASTA ist eine Alignment-Software für DNA- und Proteinsequenzen. Es besteht aus Programmen für Protein:Protein, DNA:DNA, Protein:translatierte DNA (mit Frameshifts) und geordneten oder ungeordneten Peptidsuchen. FASTQ ist eine Alignment-Software, die im Bereich der Bioinformatik verwendet wird und sowohl eine biologische Sequenz (normalerweise Nukleotidsequenz) als auch die entsprechenden Qualitätswerte speichert. FASTA besteht aus einer Beschreibungszeile und FASTQ aus vier Zeilen. Dies fasst also den Unterschied zwischen FASTA und FASTQ zusammen.

Empfohlen: