SMILES: Razlika med redakcijama

Izbrisana vsebina Dodana vsebina
Octopus (pogovor | prispevki)
Octopus (pogovor | prispevki)
Aromatičnost, razvejanost, stereokemija, izotopi
Vrstica 24:
===Vezi===
Če ni posebej označeno, se vezi med alifatskimi atomi obravnavajo kot enojne in se ne pišejo. Primer: etanol (CH<sub>2</sub>-CH<sub>2</sub>-OH) se zapiše s CCO. Mesta, na katerih se stikajo obroči, so označena s številkami na dveh nesosednjih atomih. [[Cikloheksan]] in [[dioksan]] se zato zapišeta kot C1CCCCC1 oziroma O1CCOCC1. Vezna mesta na naslednjem obroču so označena s številko 2. in tako naprej. [[Naftalen]] se zato zapiše kot c1cccc2c1cccc2. Da ne bi prihajalo do nesporazumov, se obroči od 10. dalje označujejo s predznakom '%'. Oznaka ~C12~ zato pomeni, da označeni ogljikov atom zapira 1. in 2. obroč, oznaka ~C%12~ pa da gre za 12. obroč v neki strukturi. Dvojne in trojne vezi se označujejo s simboloma '=' oziroma '#'. SMILES O=C=O pomeni [[ogljikov dioksid]] (CO<sub>2</sub>), C#N pa [[cianovodik|vodikov cianid]] (HCN).
 
===Aromatičnost===
Aromatski atomi C, O, S in N so prikazani z malimi črkami 'c', 'o', 's' in 'n'. [[Benzen]], [[piridin]] in [[furan]] se s SMILES zapišejo s c1ccccc1, n1ccccc1 in o1cccc1. Vezi med aromatskimi atomi so po dogovoru [[aromatičnost|aromatske]], vendar se lahko zapišejo zudi eksplicitno s simbolom ':'. Aromatski atomi so lahko med seboj povezani tudi z enojnimi vezmi, zato se [[bifenil]] lahko zapiše s c1ccccc1-c2ccccc2. Aromatski dušik, vezan na vodik, na primer v [[pirol]]u, mora biti zapisan z [nH]. [[Imidazol]] se zato v notaciji SMILES zapiše z n1c[nH]cc1.
 
Algoritma Daylight in OpenEye za generiranje kanonskega SMILES obravnavata aromatičnost drugače.
 
===Razvejanost===
Stranske verige se pišejo v oklepajih, na primer s CCC(=O)O za [[propanojska kislina|propanojsko kislino]] in za C(F)(F)F [[fluoroform]]. Substituirani obroči se lahko pišejo z mestom razvejanja v obroču, na primer s COc(c1)cccc1C#N in COc(cc1)ccc1C#N. Zapisa predstavljata izomera 3 in 4-cianoanizol. Takšen zapis zapisovanja substituiranih obročev je za uporabnika malo bolj razumljiv.
 
===Stereokemija===
Konfiguracije ob [[dvojna vez|dvojni vezi]] se opisujejo z znakoma "/" in "\". Primer: zapis F/C=C/F predstavlja trans-difluoroeten, v katerem sta flourova atoma na nasprotnih straneh dvojne vezi. Zapis F/C=C\F je eden od možnih zapisov cis-difluoroetena, v katerem sta fluorova atoma na isti strani dvojne vezi.
 
Konfiguracija na kvartetnem ogljiku se opiše z znakoma @ ali @@. L-alanin, ki je najbolj pogost anantiomer [[amino kislina|amino kisline]] [[alanin]], se lahko zapiše z N[C@@H](C)C(=O)O. Simbola @@ pomenita, da si substituente vodik (H), metil (C) in karboksilat (C(=O)O) sledijo v smeri urnega kazalca, kadar gledamo od dušika vzdolž vezi do hiralnega centra. D-alanin se lahko zapiše z N[C@H](C)C(=O)O. Vrstni red substituent v nizih SMILES je zelo pomemben in D-alanin se lahko zapiše tudi z N[C@@H](C(=O)O)C.
 
===Izotopi===
[[Izotop]]i se zapisujejo s celoštevilčnimi vrednostmi njihove [[atomska masa|atomske mase]], katerim sledi [[kemijski simbol|simbol]] izotopa. [[Benzen]] z enim ogljikom C14, se zapiše z [14c]1ccccc1, devterokloroform pa z [2H]C(Cl)(Cl)Cl.
 
{{chem-stub}}