Bioinformatika: Béda antara owahan

Konten dihapus Konten ditambahkan
Magioladitis (parembugan | pasumbang)
c →‎Pranala njaba: All info is kept in Wikidata, removed: {{Link FA|id}} using AWB (10903)
Arupako (parembugan | pasumbang)
c éjaan, replaced: yaiku → ya iku (20) using AWB
Larik 1:
[[Gambar:Protein_alignment.jpg|thumb|420px|''[[#Panyejajaran sekuens|Sequence alignment]]''; salah siji aplikasi dhasar bioinformatika. [[Sekuens biologis]] sing dianalisis ing bab iki yaikuya iku sekuens [[asam amino]] saka papat [[protein]] [[hemoglobin]].]]
 
'''Bioinformatika''' ([[basa Inggris]]: ''bioinformatics'') iku ([[èlmu]] sing nyinaoni) panrapan tèknik [[komputasi]]onal kanggo nglola lan nganalisis informasi [[biologi]]s. Bidang iki nyakup panrapan métodhe-métodhe [[matématika]], [[statistika]], lan [[informatika]] kanggo mecahaké masalah-masalah biologis, utamané kanthi migunaaké sekuens [[DNA]] lan [[asam amino]] sarta informasi sing ana kaitané. Conto topik utama bidang iki ngliputi [[basis data]] kanggo ngelola informasi biologis, panyejajaran sekuens (''sequence alignment''), prédiksi struktur kanggo ngramalaké wangun struktur [[protein]] uga struktur sékundhèr [[RNA]], analisis [[filogenetika|filogenetik]], lan analisis ekspresi [[gen]].
Larik 14:
Selaras kaliyan jinis informasi biologis sing disimpen, [[basis data]] sekuens biologis bisa arupa basis data primer kanggo nyimpen sekuens primer [[asam nukleat]] utawa [[protein]], basis data sekunder kanggo nyimpen motif sekuens [[protein]], lan basis data struktur kanggo nyimpen data struktur protein utawa asam nukleat.
 
Basis data utama kanggo sekuens [[asam nukleat]] saiki yaikuya iku [http://www.ncbi.nlm.nih.gov/Genbank/index.html GenBank] (Amérika Sarékat), [http://www.ebi.ac.uk/embl/ EMBL] (Éropah), lan [http://www.ddbj.nig.ac.jp/ DDBJ]{{en}} (''DNA Data Bank of Japan'', [[Jepang]]). Katelu basis data kasebut kerja bebarengan lan ijol-ijolan data saben dina kanggo njaga kawiyaran cakupan saben basis data. Sumber utama data sekuens asam nukleat yaikuya iku submisi langsung saka periset individual, proyèk sekuensing [[genom]], lan pandaftaran [[paten]]. Isi saliyané sekuens asam nukleat, entri ing basis data sekuens asam nukleat umumé ngandhut informasi ngenani jinis asam nukleat ([[DNA]] utawa [[RNA]]), jeneng [[organisme]] sumber asam nukleat kasebut, lan pustaka sing ana kaitané karo sekuens asam nukleat kasebut.
 
Sauntara iku, conto sapérangan basis data wigati sing nyimpen sekuens primer protein yaikuya iku [http://pir.georgetown.edu/home.shtml PIR] (''Protein Information Resource'', Amérika Sarékat), [http://au.expasy.org/sprot/ Swiss-Prot] (Éropah), lan [http://www.ebi.ac.uk/trembl/ TrEMBL] (Éropah). Katelu basis data kasebut wis digabungaké ing [http://www.ebi.uniprot.org/index.shtml UniProt] (sing dana utamané saka Amérika Sarékat). Entri ing UniProt ngandhut informasi ngenani sekuens protein, jeneng organisme sumber protein, pustaka sing ana kaitané, lan komentar sing umumé isiné panjlasan ngenani fungsi protein kasebut.
 
[http://www.ncbi.nlm.nih.gov/BLAST/ '''BLAST'''] (''Basic Local Alignment Search Tool'') arupa perkakas bioinformatika sing gumandhéng raket karo panggunaan basis data sekuens biologis. Panlusuran BLAST (''BLAST search'') ing basis data sekuens mungelaké èlmuwan kanggo nggolèki sekuens asam nukleat uga protein sing mèmper karo sekuens tinentu sing diduwèni. Bab iki migunani umpamané kanggo nemokaké [[gen]] sajenis ing sapérangan [[organisme]] utawa kanggo mriksa kaabsahan asil [[sekuensing]] uga kanggo mriksa fungsi gen asil sekuensing. [[Algoritma]] sing ndhasari kerja BLAST yaikuya iku panyejajaran sekuens.
 
[http://www.rcsb.org/pdb/ PDB] (''Protein Data Bank'', Bank Data Protein) yaikuya iku basis data tunggal sing nyimpen modhèl struktural telung dimensi [[protein]] lan [[asam nukleat]] asil panemton eksperimental (kanthi [[kristalografi sinar-X]], [[spektroskopi NMR]] lan [[mikroskopi elektron]]). PDB nyimpen data struktur minangka [[koordinat telung dimensi]] sing nggambaraké posisi [[atom]]-atom ing njero protein utawa asam nukleat.
 
=== Panyejajaran sekuens ===
'''Panyejajaran sekuens''' ('''''sequence alignment''''') yaikuya iku prosès panyusunan/pangaturan loro utawa luwih [[sekuens]] saéngga pepadhan sekuens-sekuens kasebut katon nyata. Asil saka prosès kasebut uga disebut minangka ''sequence alignment'' utawa ''alignment'' waé. Larik sekuens ing sawijining ''alignment'' diwènèhi sisipan (umumé kanthi tandha "–") saéngga kolom-kolomé ngamot karakter sing identik utawa padha ing antarané sekuens-sekuens kasebut. Ing ngisor iki conto ''alignment'' DNA saka rong sekuens cendhak DNA sing béda, "ccatcaac" lan "caatgggcaac" (tandha "|" nedahaké kacocokan utawa ''match'' ing antarané loro sekuens iku).
 
ccat---caac
Larik 31:
''Sequence alignment'' arupa metode dhasar ing analisis sekuens. Metode iki digunaaké kanggo nyinaoni [[évolusi]] sekuens-sekuens saka leluhur sing padha (''common ancestor''). Ora cocoké (''mismatch'') ing ''alignment'' diasosiasikaké kanthi prosès [[mutasi]], éwadéné kasenjangan (''gap'', tandha "–") diasosiasikaké kanthi prosès insersi utawa delesi. ''Sequence alignment'' mènèhi [[hipotesis]] marang prosès [[évolusi]] sing dumadi ing sekuens-sekuens kasebut. Umpamané, loro sekuens ing conto ''alignment'' ing ndhuwur bisa dadi évolusi saka sekuens sing padha "ccatgggcaac". Ing kaitané karo bab iki, ''alignment'' uga bisa nedahaké posisi-posisi sing dipertahankan (''conserved'') sakwéné évolusi ing sekuens-sekuens [[protein]], sing nedahaké yèn posisi-posisi kasebut bisa dadi wigati kanggo struktur utawa fungsi protein kasebut.
 
Saliyané iku, ''sequence alignment'' uga dipigunaaké kanggo nggolèki sekuens sing mèmper utawa padha ing [[basis data]] sekuens. BLAST yaikuya iku sawijining metode ''alignment'' sing asring dipigunaaké ing panlusuran basis data sekuens. BLAST migunaaké algoritma [[heuristik]] ing panyusunan ''alignment''.
 
Sapérangan metode ''alignment'' liya sing ndhisiki BLAST yaikuya iku metode "Needleman-Wunsch" lan "Smith-Waterman". Metode Needleman-Wunsch digunaaké kanggo nyusun '''''alignment'' global''' ing antarané loro utawa luwih sekuens, yaikuya iku ''alignment'' kanggo sadawané sekuens kasebut. Metode Smith-Waterman ngasilaké '''''alignment'' lokal''', yaikuya iku alignment kanggo bagéan-bagéan njero sekuens. Kaloro metode kasebut nerapaké [[pamrograman dinamik]] (''dynamic programming'') lan mung efektif kanggo ''alignment'' rong sekuens ('''''pairwise alignment''''')
 
Clustal yaikuya iku program bioinformatika kanggo ''alignment'' multipel ('''''multiple alignment'''''), yaikuya iku ''alignment'' sapérangan sekuens sisan. Loro varian utama Clustal yaikuya iku [http://www.ebi.ac.uk/clustalw/ ClustalW] lan [http://bips.u-strasbg.fr/en/Documentation/ClustalX/ ClustalX].
 
Metode liya sing bisa ditrepaké kanggo ''alignment'' sekuens yaikuya iku metode sing gegandhéngan karo '''''Hidden Markov Model''''' ("Modhél Markov Kadhelikaké", '''HMM'''). HMM iku modhèl statistika sing mula bukané dipigunaaké ing [[èlmu komputer]] kanggo ngenali wicaraning [[menungsa|Manungsa]] (''speech recognition''). Saliyané dipigunaaké kanggo alignment, HMM uga dipigunaaké ing metode-metode analisis sekuens liyané, kaya prediksi dhaérah pawènèh kode protein ing [[genom]] lan prédhiksi struktur sékundhèr protein.
 
=== Prédhiksi struktur protein ===
[[Gambar:Hemagglutinin molecule.png|thumb|right|Model protein hemaglutinin saka [[virus]] [[influensa]]]]
Sacara kimia/fisika, wangun struktur [[protein]] didungkap kanthi [[kristalografi sinar-X]] utawa kanthi [[spektroskopi NMR]], nanging rong metode iki banget ngentèkaké wektu lan rélatif larang. Sauntara iku, metode [[sekuensing]] protein rélatif luwih gampang ndungkap [[sekuens]] [[asam amino]] protein. Prédhiksi struktur protein ngupaya ngramalaké struktur telung dimensi protein adhedhasar sekuens asam aminoné (kanthi tembung liya, ngramalaké struktur tersier lan struktur sékundhèr adhedhasar struktur primer protein). Sacara umum, metode prédhiksi struktur protein sing ana saiki bisa dikategoriaké dadi rong klompok, yaikuya iku metode pamodhèlan protein komparatif lan metode pamodhèlan ''de novo''.
 
'''Pamodhèlan protein komparatif''' (''comparative protein modelling'') ngramalaké struktur sawijining protein adhedhasar struktur protein liya sing wis dimangertèni. Salah siji panrapan metode iki yaikuya iku '''pamodhèlan homologi''' (''homology modelling''), yaikuya iku prédhiksi struktur tersier protein adhedhasar pepadhan struktur primer protein. Pamodhèlan homologi didhasaraké ing [[teori]] yèn rong protein sing [[homolog]] nduwèni struktur sing mèmper banget siji lan sijiné. Ing metode iki, struktur sawijining protein (disebut protein target) ditemtokaké adhedhasar struktur protein liya (protein templat) sing wis dingertèni lan nduwèni kamèmperan sekuens karo protein target kasebut. Saliyané iku, panrapan liya pamodhèlan komparatif yaikuya iku '''''protein threading''''' sing didhasaraké ing kamèmperan struktur tanpa kamèmperan sekuens primèr. Latar wingking ''protein threading'' yaikuya iku struktur protein luwih dikonservasi tinimbang sekuens protein sakwéné évolusi; dhaérah-dhaérah sing wigati kanggo fungsi protein dipertahankan strukturé. Ing pandekatan iki, struktur sing paling kompatibel kanggo sawijining sekuens asam amino dipilih saka kabèh jinis struktur telung dimensi protein sing ana. Metode-metode sing kagolong ing ''protein threading'' ngupaya nemtokaké tingkat kompatibilitas kasebut.
 
Ing pandekatan '''''de novo''''' utawa ''ab initio'', struktur protein ditemtokaké saka sekuens primèré tanpa mbandhingaké karo struktur protein liya. Ana akèh kamungelan ing pandekatan iki, umpamané kanthi nirokaké prosès panglipetan (''folding'') protein saka sekuens primèré dadi struktur tersieré (umpamané kanthi simulasi [[dinamika molekular]]), utawa kanthi optimisasi global fungsi energi protein. Prosedur-prosedur iki luwih mbutuhaké prosès komputasi sing intens, saéngga saiki mung dipigunaaké nalika nemtokaké struktur protein-protein cilik. Sapérangan usaha wis dilakokaké kanggo ngatasi kakurangan sumber daya komputasi kasebut, umpamané kanthi [[superkomputer]] (umpamané superkomputer [[Blue Gene]] [http://www.research.ibm.com/bluegene/] saka [[IBM]]) utawa [[komputasi kadistribusi]] (''distributed computing'', umpamané proyèk [http://folding.stanford.edu/ Folding@home]) uga [[komputasi grid]].