Mednarodni kemijski identifikator: Razlika med redakcijama

Izbrisana vsebina Dodana vsebina
Luckas-bot (pogovor | prispevki)
m r2.5.2) (robot Dodajanje: sh:InChI
Marko3 (pogovor | prispevki)
Brez povzetka urejanja
Vrstica 1:
'''Mednarodni kemijski identifikator IUPAC''' (InChI, /ˈɪntʃiː/) je tekstenbesedilni [[identifikator]] [[kemijska spojina|kemijskih spojin]], ki je zasnovan tako, da zagotovi standarden in razumljiv način zapisovanja podatkov o [[molekula|molekuli]] in omogoča iskanje tovrstnih informacij v bazah podatkov in na spletu. Sistem sta razvila [[IUPAC]] in [[NIST]] v letih 2000-20052000–2005. Oblika in algoritmi niso zakonsko zaščiteni in so prosto dostopni pod pogoji LGPL, sam naziv "InChI" pa je zaščitena blagovna znamka IUPAC.<ref name=McNaught2006>{{cite news
| last = McNaught
| first = Alan
Vrstica 12:
 
==Ime==
Mednarodni kemijski identifikator se je na začetku imenoval IChI (IUPAC Chemical Identifier). Julija 2004 se je preimenoval v INChI (IUPAC-NIST Chemical Identifier), novembra 2004 pa v InChI (IUPAC International Chemical Identifier) in je zaščitena blagovna znamka IUPAC.
 
==Opis==
Identifikatorji InChI opisujejo kemijske spojine v vešslojnih informacijah, v katere spadajo [[atom]]i in njihove medsebojne povezave ter informacije o [[tavtomerija|tavtomeriji]], [[izotop]]ih, stereokemiji in [[električni naboj|električnih nabojih]]. V sistem niso vedno zajeti vsi sloji. Primer: če podatki o tavtomeriji za neko spojino niso pomembni, je tavtomerni sloj lahko izpuščen.
 
InChI se od od zelo razširjenega [[CAS število|CAS CAS|števila CAS]] razlikuje v treh pogledih:
 
* ni avtorsko zaščiten
Vrstica 23:
* večina informacij v InChI je bralcu razumljiva
 
InChI je torej nekakšna posplošena in ekstremnoskrajno formalizirana verzija IUPACovihIUPAC-ovih imen kemijskih spojin. InChI lahko izrazi več informacij kot enostavnejši [[SMILES]] in se od njega razlikuje po tem, da ima vsaka struktura enoznačen InChI, kar je pomembno za uporabo v bazah podatkov. InChI ne daje informacij o trodimenzionalnih koordinatah atomov. Za take primere se lahko uporabi format [[PDB]].
 
Pretvarjanje strukturnih informacij o spojini v enoten InChI identifikator poteka v treh korakih: normalizacija, ki odstrani vse odvečne informacije, kanonizacija, ki vsakemu atomu pripiše enoznačno (zaporedno) številko, in serializacija, ki podatke pretvori v niz znakov.
 
'''InChIKljuč ključInChI''', ki je poznan tudi kot '''[[Sekljalna funkcija|sesekljani]] InChI''', je niz s stalno dolžino 25 znakov, ki je zgoščena digitalna oblika zapisa InChI in za bralca ni razumljiva. InChIKljuč ključInChI se je začel uporabljati septembra 2007, da bi olajšal iskanje kemijskih spojin na spletu, ker je bilo iskanje s celotnim InChI problematično.<ref name=IUPACInChIKey>{{cite web
| title = The IUPAC International Chemical Identifier (InChI)
| publisher = [[IUPAC]]
| date = 5. Septemberseptember 2007
| url = http://www.iupac.org/inchi/release102.html
| accessdate = 2007-09-18. 9. 2007}}</ref>
 
Končna verzija programske opreme InChI z oznako 1.02 je bila izdana januarja 2007. Zadnja verzija generira tako imenovani standardni InChI, ki uporabnikom ne dopušča izbiranja opcij na slojih stereokemije in tavtomerije. Standardni InChI ključ InChI je binarna verzija standardnega niza InChI.
 
==Oblika zapisa in sloji==
Vsak InChI se začne z uvodnim nizom "InChI =", kateremu sledi številka verzije, trenutno 1. Ostale informacije so strukturirane kot sekvence slojev in podslojev. Vsak sloj daje specifično vrsto informacij. Sloji in podsloji so ločeni s poševnico "/" in se začenjajo z značilnim predznakom. Izjema je podsloj za kemijsko formulo, ki je del glavnega sloja. Sistem ima šest slojev z nekaj podsloji:
 
#Glavni sloj
#* [[Kemijska formula]] (brez predznaka) je edini podsloj, ki mora biti v vseh InChI.
#* [[Kemijska vez|Povezava atomov]] (predznak "c"), v katerem so opisi medsebojnih povezav atomov. Atomi v kemijskih formulah, razen vodika, so oštevilčeni po sekvencah.
#* [[Vodik|Vodikovi atomi]] (predznak "h"). Podsloj opisuje, koliko vodikovih atomov je vezanih na posameznih drugih atomih.
# [[Električni naboj|Nabojni sloj]]
Vrstica 48:
# [[Stereokemija|Stereokemijski sloj]]
# [[Izotop|Izotopski sloj]]
# Stalni-H H-sloj
# Povezovalni sloj
 
Vrstica 63:
|}
 
==InChIKljuč ključInChI==
[[Slika:Morphin - Morphine.svg|180px|thumb|right|Zgradba morfina]]
Zgoščeni 25 znakov dolgi ključ InChI ključ je binarna verzija InChI, narejena z algoritmom SHA-256. Ključ InChI ključ omogoča enostavno iskanje kemijskih spojin na spletu.<ref name=IUPACInChIKey>{{cite web
| title = The IUPAC International Chemical Identifier (InChI)
| url = http://www.iupac.org/inchi/release102.html}}</ref> Večina kemijskih struktur, ki so prišle na splet do leta 2007, je zapisana v formatu [[GIF]] formatu, zato se jih na spletu ne da iskati po njihovih kemijskih zgradbah.
 
Celoten InChI identifikator InChI je za iskanje spojin predolg, zato so razvili InChI ključ InChI. Pri iskanju s ključem obstaja možnost, da imata dve spojini enak ključ, vendar je ta možnost izjemno majhna. Verjetnost podvajanja prvih štirinajstštirinajstih znakov InChI ključa InChI je ocenjena na eno podvajanje v 75 bazah podatkov, če bi vsaka baza podatkov vsebovala po eno milijardo struktur. Vse baze podatkov skupaj trenutno vsebujejo manj kot 50 milijonov struktur, zato je možnost podvajanja skoraj izključena.
 
Prvih 14 znakov InChI ključa InChI je rezultat sekljanja podatkov iz InChI o povezavah, katerimki jim sledi črtica (-). Črtici sledi 8 znakov, ki so rezultat sekljanja ostalih slojev InChI. Predzadnji znak v binarnem nizu je oznaka verzije, zadnji pa kontrolna vsota.
 
Primer: morfin ima zgradbo, ki je prikazana na zgornji sliki. InChI morfina je:
 
InChI = 1/C17H19NO3/c1-18-7-6-17-10-3-5-13(20)16(17)21-15-12(19)4-2-9(14(15)17)8-11(10)18/h2-5,10-11,13,16,19-20H,6-8H2,1H3/t10-,11-,13-,16-,17-/m0/s1,
 
njegov ključ InChI ključ pa :
 
BQJCRHHNABKAKU-XKUOQXLYBY.<ref name=morphine>{{cite web
Vrstica 83:
| publisher = Chemspider
| url = http://www.chemspider.com/RecordView.aspx?id=5760
| accessdate = 2007-09-18. 9. 2007}}</ref>
 
==Zunanje povezave==