SMILES: Razlika med redakcijama

Izbrisana vsebina Dodana vsebina
Addbot (pogovor | prispevki)
m Bot: Migracija 27 interwikija/-ev, od zdaj gostuje(-jo) na Wikipodatkih, na d:q466769
SportiBot (pogovor | prispevki)
pravopis
Vrstica 4:
Izvirno specifikacijo SMILES sta v poznih 1980. letih razvila Arthur in David Weininger. Specifikacijo so kasneje razširili in dodelali drugi avtorji, med katerimi je najpomembnejši Daylight Chemical Information Systems Inc.. Leta 2007 je neformalna skupina kemikov Blue Obelisk razvila javno dostopen standard, imenovan "OpenSMILES". Med druge linearne notacije spadajo Wiswesser Line Notation (WLN), ROSDAL in SLN (Tripols Inc.).
 
Avgusta 2006 je [[IUPAC]] kot standard za prikazovanje kemijskih formul uvedel [[mednarodni kemijski identifikator]] (InChI). SMILES je po splošnem mnenju nekoliko boljši, ker je malo bolj čitljiv kot InChI in ima široko programsko podporo z obširnim teoretičnim ozadjem, na primer s [[teorija grafov|teorijo grafov]].
 
==Terminologija==
Termin SMILES se nanaša na vrstični sistem znakov za kodiranje molekularnih struktur in bi se moral striktno imenovati "niz SMILES". Termin se uporablja tudi za druge namene, vendar je njegov pomen v posameznem primeru povsem razviden iz konteksta. Nekaj zmede pri uporabi lahko povzročita naziva '''Kanonski''' in '''Izomerni SMILES'''. Izrazi, ki opisujejo različne atribute nizov SMILES, se med seboj ne izključujejo.
 
Isto molekulo se običajno lahko zapiše z več enakovrednimi SMILES. Strukturo [[etanol]]a (C<sub>2</sub>H<sub>5</sub>OH) se lahko na primer zapiše s CCO, OCC in C(O)C. Da bi se za vsako strukturo generiral en sam SMILES, ne glede na vrstni red atomov v molekuli, so se razvili številni algoritmi. Ta SMILES je za vsako strukturo edinstven, čeprav je odvisen od kanonizacijskega algoritma, ki ga je generiral, in se imenuje '''Kanonski SMILES'''. Vsi algoritmi najprej pretvorjo SMILES v notranjo predstavitev molekularne strukture in ne manipulirajo enostavno z nizi znakov kot se včasih domneva. Za generiranje Kanonskega SMILES je več algoritmov, med katerimi so najopaznejši tisti, ki so jih razvili v Daylight Chemical Information Systems, OpenEye Scientific Software, MEDIT in Chemical Computing Group. Skupne aplikacije Kanonskega SMILES so indeksirane in zagotavljajo edinstvenost molekul v bazah podatkov.
 
Notacija SMILES omogoča tudi specificiranje konfiguracij na tetraedričnih centrih in dvojnih vezeh. Tovrstne strukture kodira '''Izomerni SMILES''', ki omogoča tudi natančno specifikacijo [[hiralnost]]i. Naziv Izomerni SMILES se uporablja tudi za SMILES za specificiranje [[izotop]]ov.
 
==Označevanje na osnovi grafa==
V računalniški proceduri, ki temelji na grafu spojine, se najprej odstranijo vodikovi atomi, zatem pa se odprejo obroči in se razvijejo v obliko razvejanega drevesa. Mesta, kjer so obroči prekinjeni, se označujejo s številkami, ki omogočajo povezovanje veznih točk. Za označevanje mest, kjer se glavna veriga razveja, se uporabljajo oklepaji.
 
==Primeri==
Vrstica 23:
 
===Vezi===
Če ni posebej označeno, se vezi med alifatskimi atomi obravnavajo kot enojne in se ne pišejo. Primer: etanol (CH<sub>2</sub>-CH<sub>2</sub>-OH) se zapiše s CCO. Mesta, na katerih se stikajo obroči, so označena s številkami na dveh nesosednjih atomih. [[Cikloheksan]] in [[dioksan]] se zato zapišeta kot C1CCCCC1 oziroma O1CCOCC1. Vezna mesta na naslednjem obroču so označena s številko 2. in tako naprej. [[Naftalen]] se zato zapiše kot c1cccc2c1cccc2. Da ne bi prihajalo do nesporazumov, se obroči od 10. dalje označujejo s predznakom '%'. Oznaka ~C12~ zato pomeni, da označeni ogljikov atom zapira 1. in 2. obroč, oznaka ~C%12~ pa da gre za 12. obroč v neki strukturi. Dvojne in trojne vezi se označujejo s simboloma '=' oziroma '#'. SMILES O=C=O pomeni [[ogljikov dioksid]] (CO<sub>2</sub>), C#N pa [[cianovodik|vodikov cianid]] (HCN).
 
===Aromatičnost===
[[Slika:3-cyanoanisole SMILES.svg|right|thumb|350px|Prikaz kodiranja 3-cianoanizola v COc(c1)cccc1C#N.]]
Aromatski atomi C, O, SZ in N so prikazani z malimi črkami 'c', 'o', 's' in 'n'. [[Benzen]], [[piridin]] in [[furan]] se s SMILES zapišejo s c1ccccc1, n1ccccc1 in o1cccc1. Vezi med aromatskimi atomi so po dogovoru [[aromatičnost|aromatske]], vendar se lahko zapišejo zudi eksplicitno s simbolom ':'. Aromatski atomi so lahko med seboj povezani tudi z enojnimi vezmi, zato se [[bifenil]] lahko zapiše s c1ccccc1-c2ccccc2. Aromatski dušik, vezan na vodik, na primer v [[pirol]]u, mora biti zapisan z [nH]. [[Imidazol]] se zato v notaciji SMILES zapiše z n1c[nH]cc1.
 
Algoritma Daylight in OpenEye za generiranje kanonskega SMILES obravnavata aromatičnost drugače.
Vrstica 124:
 
==Pretvarjanje==
SMILES se lahko z raznimi programskimi orodji<ref>Structure Diagram Generation algorithms, Helson, 1999</ref> pretvori nazaj v dvodimenzionalen prikaz. Pretvorba ni vedno nedvoumna. Možna je tudi pretvorba v tridimenzionalen prikaz. Za pretvarjanje SMILES so na spletu na razpolago številna orodja.
 
==Glej tudi==