バイオインフォマティクスにおいて、DNAやRNA、タンパク質の配列の類似した領域を特定できるように並べること、またその結果の配列
via PubMed
バイオインフォマティクスにおいて、シーケンスアラインメントとは、DNAやRNA、タンパク質の配列(一次構造)の類似した領域を特定できるように並べたもので、機能的、構造的、あるいは進化的な配列の関係性を知る手がかりを与える。 アラインメントされたヌクレオチド残基やアミノ酸残基の配列は、典型的には行列の行として表現され、同一あるいは類似性質の配列が同じ列に並ぶようギャップが挿入される。 アラインメントの二配列が祖先を共有する場合、分岐後の一方または両方の系統において、不一致部分は点変異が、ギャップ部分はインデル(indel=挿入欠失; 挿入変異または欠失変異)が生じたものと解釈される。タンパク質の配列アラインメントでは、特定位置におけるアミノ酸の類似度は特定領域、あるいは配列モチーフが系統間でどのくらい保存されているかを示す大まかな目安と解釈できる。置換がないか、保守的置換(類似の生化学的特性を持った側鎖との置換)しかないとき、その領域は構造的、あるいは機能的に重要であると示唆される。DNAとRNAの塩基は、アミノ酸の場合よりも互いに類似しているものの、塩基対の保存は、構造的、機能的重要性を示唆している。シーケンスアラインメントは、自然言語や金融データなどの非生物配列にも用いられる。
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata · CC0
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).