1. UNIVERSIDAD NACIONAL DE MOQUEGUA
ESCUELA PROFESIONAL DE INGENIERIA AMBIENTAL
Nº 1 PRÁCTICA
“ANALISIS DE SECUENCIAS DEL GEN 16S”
CURSO:
BIOTECNOLOGIA
DOCENTE:
Dr. Hebert H. Soto Gonzales
ESTUDIANTES:
Karen Julissa Coapaza Chambilla
ILO – PERU
2021
2. I. INTRODUCCION
La secuenciación de ADN es el proceso de la determinación de una secuencia de nucleótidos de
ciertas moléculas de ADN - desde un segmento corto de una sola molécula, tal como una región
reguladora o un gen, hasta colecciones de genomas enteros. Es una técnica utilizada para
determinar la secuencia exacta de las bases (A, C, G y T) en una molécula de ADN. La secuencia
de bases de ADN lleva la información que una célula necesita para ensamblar proteínas y
moléculas de ARN. La información de la secuencia de ADN es importante para los científicos
que investigan las funciones de los genes. En la década de 1970, las primeras secuencias de ADN
se obtuvieron a través de técnicas extremadamente laboriosas. Un ejemplo es la secuenciación de
un par de docenas de bases del lac operator (Gilbert y Maxam, 1973). La primera revolución en
el campo de la secuenciación del ADN se llevó a cabo en la segunda mitad de la década de 1970
con métodos diseñados por Allan Maxam y Walter Gilbert (Maxam y Gilbert, 1977) así como por
Frederick Sanger y colaboradores (Sanger, 1977). Ambas técnicas incrementaron en gran medida
el rendimiento de la secuenciación del ADN. El método de Maxam Gilbert y colaboradores, sin
embargo, era más complejo e implicó el uso de productos químicos riesgosos. El método de
Sanger, por otra parte, ofrece una mayor eficiencia global después de una serie de optimizaciones,
en particular por la sustitución de material radioactivo para teñir los nucleótidos por el uso de la
electroforesis capilar en lugar de geles. Esta técnica dominó la secuenciación de ADN en las
siguientes décadas y condujo a la determinación de una secuencia de referencia del genoma
humano completo al comenzar el nuevo milenio (El Genoma Humano Consorcio Internacional
de Secuenciación 2001; Venter, 2001).
Bioedit es un programa gratuito para edición de alineamientos y análisis de secuencias que
funciona únicamente sobre ambiente MS/Windows. Es, sin lugar a duda, uno de los programas
más conocidos para edición de secuencias para dicho sistema operativo. BioEdit cuenta con varias
herramientas que van desde la creación de alineamientos hasta la anotación de plásmidos. En esta
oportunidad utilizaremos este programa para manipular parcialmente nuestro alineamiento recién
creado.
Sin embargo poder realizar un análisis de las secuencias de ADN, necesitamos de diversas
herramientas o programas como el BioEdit, este programa es gratuito y el más conocido, que nos
sirve para la edición de alineamiento y análisis de secuencia. BioEdit cuenta con varias
herramientas que van desde la creación de alineamientos hasta la anotación de plásmidos.
Utilizaremos este programa para manipular parcialmente el alineamiento de las secuencias a
revisar en este trabajo y poder observar la calidad de las mismas.
3. El Centro Nacional para la Información Biotecnológica (NCBI) es parte de la Biblioteca
Nacional de Medicina de Estados Unidos, una rama de los Institutos Nacionales de Salud. El
cual Almacena y constantemente actualiza la información referente a secuencias genómicas en
GenBank, un índice de artículos científicos referentes a biomedicina, biotecnología, bioquímica,
genética y genómica en PubMed, una recopilación de enfermedades genéticas humanas en
OMIM, además de otros datos biotecnológicos de relevancia en diversas bases de datos.
Dentro de sus aplicaciones encontramos el BLAST, el cual usa una matriz de sustitución de
aminoácidos o nucleótidos para calificar sus alineamientos. Dicha matriz contiene la puntuación
(score), que se le da al alinear un nucleótido o un aminoácido. El cual es muy útil para poder
alcanzar nuestros objetivos de conocer la calidad de las secuencias estudiadas.
4. II. OBJETIVOS
• Revisar los fundamentos de las técnicas de secuenciación de ácidos nucleicos.
• Efectuar el análisis y la selección de electroferogramas automatizados de
secuenciación mediante la aplicación de software libre BIOEDIT en específico el
estudio del gen ribosomal 16S.
5. III. MARCO TEORICO
3.1. BIO-EDIT
Bioedit es un programa gratuito para edición de alineamientos y análisis de
secuencias que funciona únicamente sobre ambiente MS/Windows. Es, sin
lugar a duda, uno de los programas más conocidos para edición de secuencias
para dicho sistema operativo.
BioEdit cuenta con varias herramientas que van desde la creación de
alineamientos hasta la anotación de plásmidos. (BioEdit, 2018)
3.2. NCBI (National Center For Biotechnology Information)
El Centro Nacional para la Información Biotecnológica (NCBI) es parte de
la Biblioteca Nacional de Medicina de Estados Unidos, una rama de
los Institutos Nacionales de Salud. Está localizado en Bethesda (Maryland) y
fue fundado el 4 de noviembre de 1988 con la misión de ser una importante
fuente de información de biología molecular. Almacena y constantemente
actualiza la información referente a secuencias genómicas en GenBank, un
índice de artículos científicos referentes
a biomedicina, biotecnología, bioquímica, genética y genómica en PubMed,
una recopilación de enfermedades genéticas humanas en OMIM, además de
otros datos biotecnológicos de relevancia en diversas bases de datos.
Todas las bases de datos del NCBI están disponibles en línea de manera
gratuita, y son accesibles usando el buscador Entrez.
El NCBI ofrece además algunas herramientas bioinformáticas para el análisis
de secuencias de ADN, ARN y proteínas, siendo BLAST una de las más
usadas. (Bioinf, 2016)
NCBI alberga genoma secuenciado en GenBank, y un índice de los artículos
biomédicos de investigación en PubMed Central y PubMed, así como otra
información relevante a la biotecnología. Todas estas bases de datos son
accesibles en línea con el motor de búsqueda de Entrez.
6. 3.3. ARN Ribosomal GEN 16S
El ARN ribosomal 16S (ARNr 16S o 16S rRNA) es el componente de la
subunidad menor (30S) de los ribosomas procariotas que se une a la secuencia
de Shine-Dalgarno. Los genes que lo codifican son conocidos como genes del
ARNr 16S, y se utilizan para la reconstrucción de filogenias debido a sus bajas
tasas de evolución.2
Carl Woese y George E. Fox fueron dos de los pioneros
que se basaron en las variaciones del 16S rRNA para establecer filogenias
(Wikipedia, 2005)
3.4. METODOLOGIA Y MATERIALES
3.4.1. MATERIALES:
• NCBI
• Word
• BioEdit
• Laptop
• Excel
3.4.2. METODOLOGIA
a. Abrir la secuencia Forward o “F” con ‘BioEdit’ (FILE>OPEN). Se
abrirán dos ventanas, una mostrará el electroferograma y otra la
secuencia. Mantener ambas abiertas, ubicándolas de modo que
puedan verse en simultáneo.
b. El inicio de la lectura suele estar poco definido (“secuencia sucia”)
por lo que es necesario recortarla hasta la posición a partir de la que
se observa una lectura correcta o “confiable”. Este procedimiento
se conoce como “limpiar” la secuencia.
c. Para ello se debe comparar una a una cada base de la secuencia con
la lectura del electroferograma (los picos). Comprobar que
coincidan. Las primeras 30-40 bases en general deben eliminarse.
Para ello, modificar las opciones del menú MODE desplegable
dentro de la misma ventana (seleccionar EDIT).
d. Luego seleccionar la región que será descartada y eliminarla con
SUPR). En ocasiones, puede acontecer que, en regiones de picos
7. claros y definidos, haya diferencias entre el pico y la base
informada o haya un pico no informado.
e. Cuando el error sea evidente, corregir la secuencia (MODE>EDIT,
prestar atención si deseamos sobre-escribir o insertar, seleccionar
OVERWRITE o INSERT).
f. También podrá eliminarse la región final de la lectura que esté
“sucia”. Guardar la secuencia editada en un nuevo archivo, para
conservar el original (FILE>SAVE AS, poner un nombre que
indique que corresponde a la secuencia editada).
8. IV. RESULTADOS
CODIGO
CALIDAD DE LA SECUENCIA TAMAÑO DE
LA
SECUENCIA
ORGANISMO
% DE
IDENTIDAD
BUENA MALA REGULAR
DIVERSOS-_A07_1H_01 x 978 Negativo
DIVERSOS-_A08_9H_02 x 725 Bacteria - Herbaspirillum seropedicae 88.73
DIVERSOS-_A09_1_01 x 280 Bacteria - Pseudomonas putida 83.21
DIVERSOS-_A10_9_02 x 674 Bacteria - Bacteria no cultivada 86.14
DIVERSOS-_A11_17_01 x 1163 Negativo
DIVERSOS-_B07_2H_03 x 629 Bacteria - Stenotrophomonas sp. UYSB32 75.78
DIVERSOS-_B08_10H_04 x 757 Bacteria - Leclercia adecarboxilata 83.45
DIVERSOS-_B09_2_03 x 631 Bacteria - Klebsiella grimontii 82.35
DIVERSOS-_B10_10_04 x 595 Bacteria - Enterobacter soli 71.76
DIVERSOS-_B11_18_03 x 617 Bacteria - Pseudomonas sp. 72.62
DIVERSOS-_C07_3H_05 x 762 Bacteria - Leclercia adecarboxilata 91.9
DIVERSOS-_C08_11H_06 x 644 Bacteria - Enterobacter sp. NA10140 94.29
DIVERSOS-_C09_3_05 x 627 Bacteria - Phytobacter diazotrophicus 86.58
DIVERSOS-_C10_11_06 x 635 Bacteria - Pseudomonas plecoglossicida 69.82
DIVERSOS-_C11_19_05 x 666 Bacteria - Klebsiella aerogenes 65.62
DIVERSOS-_D07_4H_07 x 679 Bacteria - Bacteria no cultivada 90.18
DIVERSOS-_D08_12H_08 x 678 Bacteria - Staphylococcus sp. EE.UU.13 84.27
DIVERSOS-_D09_4_07 x 625 Bacteria - Phytobacter diazotrophicus 89.67
DIVERSOS-_D10_12_08 x 525 Bacteria - Pseudomonas putida 86.26
DIVERSOS-_E07_5H_09 x 926 Negativo
9. DIVERSOS-_E08_13H_10 x 634 Bacteria - Paraburkholderia silvatlantica 79.97
DIVERSOS-_E09_5_09 x 272 Bacteria - Enterobacter ludwigii 88.43
DIVERSOS-_E10_13_10 x 681 Bacteria - Bacteria no cultivada 67.47
DIVERSOS-_F07_6H_11 x 619 Bacteria - Enterobacter ludwigii 95.89
DIVERSOS-_F09_6_11 x 956 Bacteria - Klebsiella sp. 81.75
DIVERSOS-_F10_14_12 x 1204 Negativo
DIVERSOS-_G07_7H_13 x 567 Bacteria - Enterobacter sp. ICBR 189 93.18
DIVERSOS-_G09_7_13 x 935 Bacteria - Enterobacter sp. 73.78
DIVERSOS-_G10_15_14 x 692 Bacteria - Enterobacter asburiae 93.4
DIVERSOS-_H07_8H_15 x 1101 Negativo
DIVERSOS-_H09_8_15 x 1262 Negativo
DIVERSOS-_H10_16_16 x 646 Bacteria - Enterobacter sp. IICDBZ9 84.42
USER_04set2007_01-
419NZ_A01_01
x 855 Bacteria - Klebsiella michiganensis 74.54
USER_04set2007_02-
526NZ_B01_03
x 612
Bacteria - Klebsiella sp. Cultivo de enriquecimiento clon
LY3
88.15
USER_04set2007_03-
419AZ_C01_05
x 745 Bacteria - Klebsiella sp. MPUS7 97.35
USER_04set2007_04-88NZ_D01_07 x 796 Bacteria - Klebsiella pneumoniae 94.39
USER_04set2007_05-88AZ_E01_09 x 665 Bacteria - Klebsiella pneumoniae 95.18
USER_04set2007_06-
526Y1_F01_11
x 351 Bacteria - Klebsiella pneumoniae 95.91
USER_04set2007_07-
419Y1_G01_13
x 293 Bacteria - Enterobacter sp. WF14-6 98.61
USER_04set2007_08-375H_H01_15 x 300 Bacteria - Klebsiella oxytoca 73.75
USER_04set2007_09-
419YZ_A02_02
x 329 Bacteria - Enterobacter sp. CB7 95.81
USER_04set2007_10-88H_B02_04 x 345 Bacteria - Endosimbionte de Sphenophorus levis 72.46
10. USER_04set2007_11-
375NZ_C02_06
449 Bacteria - Bacteria no cultivada 75.43
USER_04set2007_12-
526YZ_D02_08
x 339 Bacteria - Klebsiella sp. BR3357 95.28
USER_04set2007_13-
483NZ_E02_10
x 687 Bacteria - Enterobacter sp. 88.89
USER_04set2007_14-483H_F02_12 x 526 Bacteria - Enterobacter hormaechei 88.47
USER_04set2007_15-
456NZ_G02_14
x 775 Bacteria - Bacilo turingiensico 91.54
user_12set2007_01_A03_01 x 680 Bacteria - Kosakonia radicincitans 81.6
user_12set2007_02_B03_03 x 340 Bacteria - Bacteria del suelo no cultivada 71.52
user_12set2007_03_C03_05 x 400 Bacteria - Bacteria Enterobacteriaceae no cultivada 76.92
user_12set2007_04_D03_07 x 567 Bacteria - Kosakonia oryzae 81.93
user_12set2007_05_E03_09 x 921 Bacteria - Klebsiella pneumoniae 85.05
user_12set2007_06_F03_11 x 1347 Negativo
user_12set2007_07_G03_13 x 1185 Negativo
user_12set2007_08_H03_15 x 991 Bacteria - Bacteria no cultivada 72.15
user_12set2007_09_A04_02 x 1163 Negativo
user_12set2007_10_B04_04 x 731 Bacteria - Achromobacter sp. 76.67
user_12set2007_11_C04_06 x 959 Bacteria - Enterobacter cloacae 72.58
user_12set2007_12_D04_08 x 860 Bacteria - Bacteria enterobacteriaceae HGH0104 85.71
user_12set2007_13_E04_10 x 928 Bacteria - Pantoea stewartii 71.86
user_12set2007_14_F04_12 x 977 Bacteria - Pantoea deleyi 75.82
user_12set2007_15_G04_14 x 714 Bacteria - Klebsiella variicola 89.24
user_12set2007_16_H04_16 x 556 Bacteria - Kosakonia sacchari 79.21
usuarios_12set2007_1Y2_F04_12 x 423 Bacteria - Kosakonia radicincitans 79.2
usuarios_12set2007_2Y2_G04_14 x 407 Bacteria - Herbaspirillum sp. 86.75
usuarios_12set2007_3Y2_H04_16 x 413 Bacteria - Klebsiella sp. MB42 79.04
11. usuarios_12set2007_17_A04_02 x 812 Bacteria - Rhizobium lusitanum 71.09
usuarios_12set2007_18_B04_04 x 708 Bacteria - Enterobacter sp. 78.88
usuarios_12set2007_19_C04_06 x 520 Negativo
usuarios_12set2007_20_D04_08 x 608 Bacteria - Klebsiella pneumoniae 73.8
usuarios_12set2007_21_E04_10 x 277 Negativo
Como resultado del análisis de orden de nucleótidos de los diferentes microorganismos, se obtuvo que las 71 muestras son bacterias, sin embargo,
difieren en el tipo de especie (enterobacteria, protobacteria, etc.), resultando la mayoría de las secuencias analizadas una calidad regular (51), y en
menor cantidad las secuencias fueron 9 buenas y 11 malas, tomando como referencia el porcentaje de identidad de cada una de ellas y buscando al
momento de recortar la secuencia, una lectura confiable, guiada por las lecturas electroferogramas. En las secuencias que se obtuvieron resultados,
el BLAST nos muestra diferentes organismos, por lo cual tomamos la de mayor puntuación y porcentaje de identidad, siendo las que se muestran
en el cuadro anterior.
Cabe resaltar que hay casos donde los organismos se repiten y/o son especies no conocidas (como las no cultivadas), en el segundo caso se da
porque son especies nuevas, las cuales recién están registradas en el NCBI y su base de datos es poco conocida.
12.
13. CONCLUSIONES
• Los microogranismos que cuentan con secuencias buenas, tienen un porcentaje de
identidad mayor a 95%
• La mayoría de los microorganismos analizados cuentan con una secuencia de
nucleótidos regular.
• Los softwares utilizados como el Bioedit son de mucha utilidad para el análisis de
los cromatogramas.
38. BIBLIOGRAFÍA
BioEdit. (15 de abril de 2018). Obtenido de
http://bioinf.ibun.unal.edu.co/documentos/multAlignmentCBIB.pdf
Bioinf. (16 de Octubre de 2016). Obtenido de
http://bioinf.ibun.unal.edu.co/cbib/estudiantes/1-07/ncbi.pdf
Wikipedia. (20 de Junio de 2005). Obtenido de
https://es.wikipedia.org/wiki/ARN_ribosomal_16S