banner
Hogar / Blog / HighAltitudeOmicsDB, un recurso integrado para alta
Blog

HighAltitudeOmicsDB, un recurso integrado para alta

Apr 03, 2023Apr 03, 2023

Scientific Reports volumen 13, Número de artículo: 9307 (2023) Citar este artículo

Detalles de métricas

Millones de personas en todo el mundo visitan, viven o trabajan en el entorno hipóxico que se encuentra a gran altura y es importante comprender las respuestas biomoleculares a este estrés. Esto ayudaría a diseñar estrategias de mitigación para enfermedades de altura. A pesar de una serie de estudios que abarcan más de 100 años, aún se desconocen en gran medida los complejos mecanismos que controlan la aclimatación a la hipoxia. Para identificar marcadores diagnósticos, terapéuticos y predictivos potenciales para el estrés por HA, es importante comparar y analizar exhaustivamente estos estudios. Con este objetivo, HighAltitudeOmicsDB es un recurso único que proporciona una compilación completa, seleccionada, fácil de usar y detallada de varios genes/proteínas que han sido validados experimentalmente para asociarse con varias condiciones de HA, sus interacciones proteína-proteína (PPI) y genes. ontología (GO) similitudes semánticas. Para cada entrada de la base de datos, HighAltitudeOmicsDB almacena adicionalmente el nivel de regulación (regulación ascendente/descendente), cambio de pliegue, grupo de control de estudio, duración y altitud de exposición, tejido de expresión, organismo fuente, nivel de hipoxia, método de validación experimental, lugar /país de estudio, etnia, ubicación geográfica, etc. La base de datos también recopila información sobre asociación de enfermedades y fármacos, nivel de expresión específico de tejido, asociaciones de vías GO y KEGG. El recurso web es una plataforma de servidor única que ofrece redes PPI interactivas y matrices de similitud semántica GO entre los interactuadores. Estas características únicas ayudan a ofrecer información mecanicista sobre la patología de la enfermedad. Por lo tanto, HighAltitudeOmicsDB es una plataforma única para que los investigadores que trabajan en esta área exploren, busquen, comparen y analicen genes/proteínas asociados a HA, sus redes PPI y similitudes semánticas de GO. La base de datos está disponible en http://www.altitudeomicsdb.in.

Un gran porcentaje de la población mundial vive en áreas de gran altitud (HA) y muchos también visitan las montañas por encima de los 2500 m para realizar actividades al aire libre como trekking, escalada y otros deportes de aventura. El ascenso rápido a gran altitud conduce a una disminución instantánea de la presión barométrica. La concentración de oxígeno sigue siendo la misma, pero se reduce el número de moléculas de oxígeno por respiración; por ejemplo, a una altitud de 3600 m, la presión barométrica disminuye a 483 mmHg y < 40 % de las moléculas de oxígeno están disponibles para respirar. Dado que la cantidad de oxígeno requerida para la actividad es la misma, el cuerpo debe adaptarse a tener menos oxígeno o hipoxia hipobárica1 . Algunos residentes de las tierras bajas se adaptan a la disponibilidad reducida de oxígeno a gran altura a través de un proceso conocido como aclimatación, pero algunos sufren diversos trastornos como el mal agudo de montaña (AMS), el edema cerebral de gran altitud (HACE) y el edema pulmonar de gran altitud (HAPE) etc.2,3. Por lo tanto, la investigación para la identificación de los primeros signos de estas alteraciones fisiológicas está cobrando impulso. Una comparación reciente en los perfiles de proteínas de las tierras bajas con su inducción a gran altura ha identificado proteínas expresadas diferencialmente como las proteínas séricas irisina, miostatina, proteínas precursoras agudas (APP), apolipoproteína A1, etc. durante la aclimatación HA4. Estas proteínas están asociadas con procesos relacionados con la energía, la regeneración del músculo esquelético, las respuestas inflamatorias y otras respuestas moleculares distintivas a gran altura5,6. En adelante, estas proteínas se propusieron como biomarcadores para predecir la aclimatación temprana de individuos a gran altura. La búsqueda de nuevos biomarcadores de proteínas en tierras bajas y muestras nativas utilizando perfiles de péptidos se ha convertido en un método importante para identificar posibles marcadores diagnósticos o terapéuticos3,6. La identificación de las proteínas expresadas diferencialmente que juegan un papel clave en el proceso de aclimatación ha ayudado a descubrir los mecanismos responsables de la aclimatación en HA. Un estudio de todo el genoma ha descubierto proteínas plasmáticas que tienen el potencial de predecir la homeostasis vascular durante HAPE7. De manera similar, un estudio transcriptómico indicó la modulación de múltiples vías y proteínas involucradas en la fase temprana de la exposición a la hipoxia hipobárica como VIM, CORO1A, CD37, STMN1, etc.8. Aunque existe una enorme cantidad de literatura disponible que ha reportado perfiles '-ómicos' de humanos y animales expuestos a grandes alturas; el verdadero desafío sigue siendo integrar todos estos estudios para producir una comprensión holística de los mecanismos en constante evolución involucrados en las adaptaciones funcionales de las células, tejidos y órganos, así como de todo el organismo en el entorno hipóxico de gran altitud. Por lo tanto, desarrollamos HighAltitudeOmicsDB donde todos estos datos dispersos se recopilan, seleccionan, analizan y visualizan. La base de datos actualmente contiene ~ 1300 asociaciones de proteínas que han sido curadas manualmente de publicaciones revisadas por pares que han demostrado experimentalmente que están reguladas por el estrés de HA. La base de datos almacena la asociación de cada proteína con estrés por HA en términos del nivel de regulación (regulación ascendente/descendente), cambio de pliegue, grupo de control de estudio, duración y altitud de exposición, tejido de expresión, organismo fuente, nivel de hipoxia, método de validación experimental, lugar/país de estudio, etnia, ubicación geográfica, etc. La base de datos también proporciona si se ha demostrado experimentalmente que la proteína está asociada como biomarcador HA y proporciona un enlace a la publicación correspondiente. La base de datos también está vinculada a otras bases de datos, como el símbolo oficial de la proteína, los alias de la proteína, la ubicación cromosómica, la longitud, la identificación de Uniprot, el número de la Comisión de enzimas (EC), la identificación de la información de la familia de proteínas (Pfam), la identificación de Protein DataBank (PDB), The Identificación de la base de datos integradora de firmas de proteínas (InterPro), identificación de la base de datos de polimorfismo de nucleótido único (dbSNP). La base de datos también presenta la información funcional de la proteína, como la anotación GO y la asociación de rutas de la Enciclopedia de genes y genomas de Kyoto (KEGG); su asociación con otras enfermedades y fármacos. La base de datos también proporciona interacciones de red proteína-proteína de cada proteína con sus 50 principales socios que interactúan. La red se puede visualizar de forma interactiva en el servidor web. Además, HighAltitudeOmicsDB calcula la similitud semántica de genes con estos 50 interactores para identificar proteínas relacionadas funcionalmente. La base de datos almacena adicionalmente los factores de transcripción que interactúan con el gen y su tipo de regulación (represión, activación, distal, proximal, etc.). Además, también se enumeran los miARN que interactúan con el gen. Por lo tanto, HighAltitudeOmicsDB es una plataforma integrada única para explorar, recuperar, comparar y evaluar genes/proteínas asociadas con el estrés por HA, sus redes PPI y la similitud semántica y la regulación por factores de transcripción y miARN. Esto ayudará a descubrir la diafonía subyacente entre las proteínas que existen para aclimatarse a la HA y también proporcionará conocimientos sobre el mecanismo en estas respuestas moleculares complejas. Por lo tanto, será útil para identificar candidatos a biomarcadores moleculares novedosos y robustos que puedan ayudar aún más en el desarrollo de nuevas estrategias de diagnóstico, pronóstico y terapéuticas para los trastornos de las alturas.

Se utilizó una combinación de varias palabras clave como "altitud elevada", "proteína", "gen", "ómica", "hipoxia hipobárica", "anoxia" para una extensa extracción de literatura de PubMed y los motores de búsqueda de Google9. Las publicaciones se examinaron manualmente para identificar genes/proteínas expresados ​​diferencialmente. Después de eliminar la redundancia y la duplicidad, se seleccionó de estas publicaciones una lista completa de proteínas que se ha encontrado que se expresan diferencialmente (DE) en HA. Para cada proteína DE, también se obtuvo su información asociada que incluye; 'Nombre de la proteína', 'Símbolo oficial de la proteína', 'Alias', 'ID humana de Entrez' homóloga, 'Organismo fuente', 'Tejido de expresión', 'Nivel de hipoxia', 'Altitud', 'Duración del experimento' , 'Nivel de regulación', 'Cambio de pliegue', 'Detalles del experimento', 'Ubicación geográfica', 'Etnia', 'Grupo de control', 'Asociado como Biomarcador'. Estudios en los que el organismo de origen no era humano, el gen/proteína humano homólogo se identificó utilizando protein BLAST contra la base de datos Uniprot. Se seleccionó la proteína humana homóloga con la mayor similitud de secuencia y la menor puntuación E. El umbral mínimo se consideró como > 80% de similitud de secuencia por pares. De esta manera, incluso para los experimentos realizados en diferentes organismos experimentales (ratones/ratas/yak/pájaro/sapo/oveja), la equivalencia/traducción humana sería más fácil. La colección se almacenó en formato de archivo de notación de objetos JavaScript (JSON) y se almacenó en MongoDB10 .

Para cada proteína, detalles adicionales como el símbolo oficial de proteína, alias de proteína, ubicación cromosómica, longitud, Uniprot ID11, Enzyme Commission (EC) Number12, Protein family Information (Pfam) ID13, Protein Databank (PDB) ID14, The Integrative Protein Signature Database (InterPro ) Id15, base de datos de polimorfismos de nucleótido único (dbSNP) Id16 se recopiló para ayudar en el enlace cruzado con otras bases de datos. Para cada proteína, su enriquecimiento GO-funcional y la anotación de la ruta se realizaron mediante la base de datos para anotación, visualización y descubrimiento integrado (DAVID) y la herramienta de mapeo KEGG, respectivamente17,18.

Para cada proteína en la base de datos, sus 50 principales interactores de proteínas fueron identificados por el servidor web Search Tool for Retrieval of Interacting proteins (STRING)19. La rigurosidad de la búsqueda se mantuvo en el nivel más alto (0,9) y el filtro se colocó para permitir un máximo de 50 proteínas asociadas como interaccionador directo de la proteína consultada. La base de datos STRING construye la red de interacciones proteína-proteína basada en siete fuentes de información, es decir, vecindad en el cromosoma, fusión de genes, coocurrencia filogenética, homología, coexpresión, interacción determinada experimentalmente, minería de texto automatizada anotada en la base de datos. El archivo de interacción se descargó de la base de datos STRING y se almacenó en formato JSON.

Para hacer que la base de datos sea más informativa, también se agregaron varios otros atributos; las asociaciones proteína-enfermedad se extrajeron de DisGeNET20; relación proteína-fármaco de la base de datos DGIdb 3.021. Todos estos atributos también se almacenaron en archivos JSON.

Las comparaciones semánticas basadas en anotaciones de Gene Ontology (GO) entre genes son un enfoque innovador para evaluar cuantitativamente las similitudes funcionales entre ellos. Se han utilizado ampliamente en diversos análisis bioinformáticos22,23. Cuanto mayor sea la puntuación de similitud semántica, mayor será la probabilidad de que dos genes/proteínas tengan una función molecular similar o participen en un proceso biológico común22. Una puntuación de similitud semántica baja muestra dos genes que imparten diferentes funciones moleculares. Para identificar la similitud semántica, cada proteína en HighAltitudeOmicsDB y sus 50 principales proteínas de interacción directa se sometieron al algoritmo GOSemSim R23.GOSemSim es un paquete R para el cálculo de similitud semántica entre términos GO, conjuntos de términos GO, productos genéticos y grupos de genes23 . Los resultados se representaron en una matriz de 51 × 51. Todos estos archivos de matriz también se almacenaron en formato de archivo JSON.

Todos los archivos JSON creados se transfirieron a la colección de bases de datos MongoDB y se cargaron en el servidor localhost mediante pymongo. Los comandos de consulta del servidor se realizaron en la brújula MongoDB. La biblioteca Vis.js se utilizó específicamente para mostrar la red de interacciones proteína-proteína24. Los ID, como Human Entrez ID, Uniprot ID, Protein Official Symbol, EC Number, PDB_ID, InterPro ID, Pfam ID, dbSNP ID y los PMID de referencia presentes en todas las tablas, están vinculados a las bases de datos correspondientes para proporcionar detalles adicionales. La interfaz web también tiene una página 'Contáctenos' que incluye un formulario de envío de datos para el envío de cualquier dato nuevo por parte del usuario. Sería revisado y agregado a la base de datos periódicamente.

HighAltitudeOmicsDB es un recurso fácil de usar y de acceso gratuito que no requiere registro previo. Es un recurso integral, no redundante y seleccionado manualmente de genes/proteínas cuyos niveles de expresión están validados experimentalmente para asociarlos con el estrés de las grandes altitudes. La base de datos puede consultarse utilizando las opciones "Examinar" y "Buscar".

La opción "Examinar" permite al usuario elegir fácilmente uno o varios genes/proteínas de la base de datos desde un menú desplegable. Alternativamente, el usuario puede cargar un archivo que contenga los símbolos oficiales de proteínas o escribir los símbolos oficiales de proteínas. Al hacer clic en el botón 'Examinar' adyacente se conecta a un formato tabular que vincula la página de proteína individual. Si la lista de usuarios contiene símbolos de proteínas que no están en la base de datos, también se proporciona una tabla separada que los destaca (Fig. 1).

La página de inicio y la opción de navegación del servidor web.

La opción "Buscar" de la base de datos ofrece múltiples opciones para explorar la base de datos en función de los intereses de investigación de los usuarios. La búsqueda por cromosoma permite hacer clic en cualquier número de cromosoma humano e identificar las proteínas de HighAltitudeOmicsDB que se encuentran en el cromosoma respectivo. La búsqueda por 'duración del experimento' permite identificar la lista de genes/proteínas cuya expresión cambia en horas/días/semanas/meses/años. La búsqueda por 'Tejido de expresión' abre un menú desplegable en el que el usuario puede elegir el tejido de interés (Fig. 2). La búsqueda por 'Etnicidad', 'organismo de origen', 'nivel de regulación', 'ubicación geográfica' abre de manera similar un menú desplegable desde el cual el usuario puede elegir la etnia, el organismo de origen, la regulación ascendente/descendente y la ubicación, respectivamente. y obtenga una lista tabular de genes/proteínas que tienen un hipervínculo a la respectiva página de información detallada de la proteína (como se explica en las siguientes secciones).

Captura de pantalla del módulo "Buscar".

Además, la opción 'Asociado como biomarcador' conduce a una lista tabular de proteínas que se han propuesto/validado como biomarcadores moleculares para el estrés por HA. Los símbolos de proteínas tienen un hipervínculo a la página de proteína respectiva que proporciona un enlace a PubMed que valida la proteína como biomarcador. Además, para obtener proteínas que son DE de una manera dependiente de la altitud, se proporciona un control deslizante interactivo para el usuario (que va desde 2200 a 9800 mt). El usuario puede establecer los valores del control deslizante y obtener genes/proteínas que están asociados con un rango de altitud definido. Esto se ha combinado con opciones (AND/OR) con el tiempo de exposición a HA y nivel de regulación (Up/Down). Por lo tanto, el usuario puede realizar consultas combinadas como proteínas reguladas hacia arriba/abajo expresadas en días en un rango de altitud de 2200–4500 mt. La lista de estas proteínas se puede descargar en formato Excel/PDF para su posterior análisis.

El servidor web también permite explorar las proteínas de HighAltitudeOmicsDB asociadas con un factor de transcripción (TF), miARN, enfermedad, fármaco, vía GO o KEGG en particular (Fig. 3).

Captura de pantalla del "Módulo de búsqueda".

Los detalles de la proteína y su asociación con HA se proporcionan en la página de información detallada que se puede dividir en seis secciones (Fig. 4).

Base de conocimientos

Detalles de la página de información de proteínas.

Esta es la primera sección de la base de datos que brinda información general sobre la proteína, como el símbolo oficial de la proteína, alias, ubicación cromosómica, longitud, ID de Uniprot, número de EC, ID de Pfam, ID de PDB, ID de InterPro, ID de dbSNP que permite el entrecruzamiento para bases de datos adicionales fácil y rápidamente. El ID de Uniprot tiene un hipervínculo a la base de datos de Uniprot.

Interacciones y semántica

Los 50 principales interactuadores directos de proteínas de cada proteína se identifican a partir de la base de datos STRING utilizando los puntos de corte descritos en la sección de metodología. La red se muestra en un formato interactivo para el usuario con funciones de traducción, acercamiento y alejamiento. Los nodos están codificados por colores (amarillo: la proteína que se está estudiando; azul: los 50 interactores principales). Los bordes también están codificados por colores (amarillo: interacciones entre la proteína que se estudia y sus 50 interactuadores directos; azul: interacciones entre los 50 interactuadores principales). La red se puede descargar fácilmente en formato .sif, que se puede visualizar fácilmente en un software de visualización de redes como Cytoscape, Bina, etc. La lista de interacciones entre ellos y su puntaje combinado se proporciona fácilmente en un formato tabular que se puede descargar en Excel/ formato PDF La tabla también cuenta con una opción de 'búsqueda' para buscar fácilmente la proteína de interés.

La puntuación de similitud semántica GO por pares se calculó entre la proteína que se estudia y sus 50 proteínas principales que interactúan, como se describe en la sección de metodología. Los resultados se visualizan como una matriz de 51 × 51. La puntuación de similitud semántica de GO > 0,8 está resaltada en color rojo en la matriz. Si alguna proteína entre los 50 principales interactuadores también forma parte de HighAltitudeOmicsDB, el símbolo de la proteína en la matriz tiene un hipervínculo a la respectiva página de información detallada de la proteína dentro de la base de datos. Esto ayuda a identificar cualquier centro funcional de proteínas que estaría asociado con HA estrés y, por lo tanto, podría arrojar luz sobre la base molecular de la aclimatación/adaptación.

Asociación con la gran altitud

Para cada proteína, su asociación con el estrés por HA se compila en un formato tabular. Los detalles se presentan como el símbolo de proteína humana, organismo fuente (organismo en el que se realizó el estudio), tejido de expresión, nivel de hipoxia, altitud, duración del experimento, nivel de expresión, cambio de pliegue, detalles del experimento, ubicación geográfica, etnia, expresión del grupo de control, detalles del grupo de control y documento de referencia. El grupo de control se define en función del plan de estudio, por ejemplo, algunos estudios tenían habitantes de las tierras bajas como grupos de control y se identificaron proteínas expresadas diferencialmente en nativos de HA o habitantes de las -JA. En algunos otros estudios, los nativos de HA se consideraron como controles y se identificaron proteínas expresadas diferencialmente en las tierras bajas. Por lo tanto, el grupo de control varía según el estudio y se menciona claramente en la base de datos. La asociación de la proteína como biomarcador también se compila, es decir, si la proteína alguna vez se valida experimentalmente para ser un biomarcador, la entrada en la columna será ser "Sí" de lo contrario "No". También se proporciona fácilmente un hipervínculo a la publicación respectiva que prueba esta asociación. Los cambios de expresión de una proteína en diferentes duraciones, tejidos y condiciones de altitud se pueden explorar, comparar y analizar fácilmente en este formato.

Asociación con TFs y miRNAs

Los factores de transcripción y los miARN son las dos moléculas reguladoras transcripcionales y postranscripcionales más importantes que ajustan la expresión de los genes. Por lo tanto, la lista de TF y miRNAs que se sabe que regulan la proteína en estudio se presenta en formato tabular. La tabla de asociaciones de TF enumera el símbolo de TF (con hipervínculo a la base de datos Genecards), su ID de Entrez, el símbolo y la ID de Entrez de la proteína que se está estudiando, el tipo de asociación, el enlace a la publicación que determinó esta asociación y la base de datos de la que se extrae la asociación. Las tablas se pueden descargar en formato Excel/CSV y cuentan con una opción de 'búsqueda' para explorar la tabla con una palabra clave definida por el usuario (Fig. 5).

Captura de pantalla de la página de información de proteínas.

De manera similar, la tabla de asociación de miRNA-gen enumera el ID de miRNA miRTarBase, el miRNA, el símbolo y el ID de Entrez de la proteína que se está estudiando, el experimento (ensayo indicador de luciferasa/western blot/PCR/inmunohistoquímica, etc.), el tipo de soporte y el enlace a la publicación respectiva ( con hipervínculo a PubMed) que determinó esta asociación. Las tablas se pueden descargar en formato Excel/CSV. La tabla también cuenta con una opción de 'búsqueda' para explorar la tabla con una palabra clave definida por el usuario.

Ontología génica y anotaciones de vías KEGG

Las anotaciones de Gene Ontology se presentan en formato tabular. Se enumeran GO ID, GO Term y GO Type. El GO ID también tiene un hipervínculo a QuickGO, que proporciona anotaciones GO detalladas25. Las anotaciones de la ruta KEGG también se compilan y presentan como KEGG ID y KEGG Term. El ID de KEGG está vinculado a la base de datos de KEGG que proporciona detalles adicionales sobre las vías respectivas.

Ambas tablas se pueden descargar en formato Excel/CSV y tienen una opción de 'búsqueda' incorporada para la búsqueda de palabras clave.

Asociación de proteínas con otras enfermedades y fármacos

En esta sección se proporcionan detalles de la asociación entre fármaco y enfermedad. La información se representa en forma de tablas pertenecientes a cada categoría respectivamente (Fig. 4). La primera tabla muestra información sobre el gen-objetivo y su fármaco asociado. Este tipo de información puede ayudar a los usuarios a guiar/diseñar cualquier experimento dirigido a fármacos basado en genes/proteínas. Estas dos tablas están equipadas con la opción de "búsqueda" que facilita la búsqueda de términos definidos por el usuario en tablas extensas. Las tablas también se pueden descargar en formato Excel/PDF.

HighAltitudeOmicsDB contiene ~ 1300 asociaciones de 820 proteínas que se han encontrado expresadas diferencialmente en altitudes elevadas. Una revisión detallada de la base de datos muestra que todas las proteínas se obtuvieron de estudios experimentales en 25 tejidos (Fig. 6a). Estos tejidos provienen de 7 especies animales, es decir, humanos, ovejas, ratas, ratones, yaks, pájaros y sapos (Fig. 6b). Los seres humanos como organismos fuente pueden caracterizarse aún más en términos de su origen étnico, es decir, estadounidenses, tibetanos, chinos Han, italianos, nepalíes, ladakhi y alemanes. El tiempo de exposición depende del organismo fuente y oscila entre 0,5 h y 110 días para la población nativa.

Estadísticas de HighAltitudeOmicsDB (a) Distribución de proteínas de gran altitud según su tejido de expresión. ( b ) Distribución de proteínas de gran altitud estudiadas en diferentes organismos fuente.

La base de datos contiene dos tipos de anotaciones funcionales: enriquecimiento de rutas GO y KEGG. El enriquecimiento GO muestra 'Proceso metabólico' (GO: 0,042,572), 'Ensamblaje de brazo de dineína externa' (GO: 0,036,158), 'Respuesta a especies reactivas de oxígeno' (GO: 0,000,302) como los principales procesos biológicos (Fig. 7a). El 'proceso metabólico' está altamente asociado con la pérdida de peso debido al mecanismo de adaptación a la gran altura26. A gran altura, la inducción de hipoxia hipobárica activa la proteína HIF que regula aún más los genes responsables de mediar los cambios en el metabolismo/energética celular que conducen a la pérdida de peso debido al aumento del gasto de energía27. El segundo proceso biológico 'Ensamblaje del brazo externo de dineína' es el proceso para los ensamblajes axonemales. El aumento de la longitud y la densidad de los cilios tipo axonema debido a la hipoxia se ha asociado con la muerte celular28. Por último, la 'Respuesta a las especies reactivas de oxígeno' es el reflejo del estado redox de la célula, y las alteraciones en el estado redox debido a la hipoxia hipobárica pueden provocar estrés oxidativo y daños en el ADN3. De manera similar, términos como 'Actividad de fructosa-bisfosfato aldolasa', 'Actividad de oxidorreductasa', 'Actúa sobre donantes emparejados', 'Incorporación o reducción de oxígeno molecular', 'Actividad de oxidorreductasa', 'Actúa sobre peróxido como aceptor', 'Actividad de transferencia de electrones' ' y 'Unión de ATP', etc. resultan ser las principales funciones moleculares de las proteínas presentes en la base de datos (Fig. 7b). Todas las funciones moleculares son pasos directos o mecanismos de retroalimentación asociados con la fosforilación oxidativa (respiración aeróbica). Estudios clínicos recientes han revelado que los montañeses tienen un alto porcentaje de mitocondrias en el tejido del músculo gastrocnemio, lo que les ayuda a adaptarse a un entorno de alto gasto energético29. 'Señalosoma COP9' y 'Actomiosina' son los dos términos de componentes celulares que se encuentran más enriquecidos en conjuntos de proteínas expresadas diferencialmente presentes en la base de datos (Fig. 7c). El señalosoma COP9 es parte del complejo de degradación proteasomal de ubiquitina que controla la expresión de pVHL, HIF-1α y otros factores de transcripción sensibles al oxígeno regulados durante la hipoxia hipobárica30. Mientras que la actomiosina es un citoesqueleto del complejo de fibra de actina-miosina presente en diferentes tejidos musculares como el músculo esquelético. La composición del tipo de fibra muscular tanto de los animales adultos como de los humanos se altera notablemente durante la exposición crónica a grandes alturas.

Caracterización funcional de proteínas de altura expresadas diferencialmente (a) GO: procesos biológicos. (b) GO: funciones moleculares (c) GO: compartimento celular y (d) enriquecimiento de la vía KEGG.

El enriquecimiento de la ruta KEGG muestra 'hsa00910: metabolismo del nitrógeno' como la ruta más enriquecida en el conjunto de proteínas HA expresadas diferencialmente (Fig. 7d). El metabolismo del nitrógeno es un proceso de producción de óxidos de nitrógeno y se ha descubierto que estos óxidos, como el nitroso, el nitrito y el nitrato, desempeñan un papel importante en la respuesta de adaptación a la gran altitud31. La anotación funcional general reveló la asociación de proteínas presentes en la base de datos con respuestas de estrés hipóxico hipobárico, lo que respalda la exhaustividad y especificidad de la base de datos.

Durante el ascenso a grandes altitudes, el cuerpo sufre estrés ambiental extremo como hipoxia, hipoxemia, estrés por frío, etc., que provocan muchos cambios fisiológicos en el cuerpo para su aclimatación al estrés HA. Los cambios fisiológicos desequilibrados pueden provocar anomalías o enfermedades como el edema pulmonar de gran altitud (HAPE), el edema cerebral de gran altitud (HACE), los trastornos cardiovasculares (ECV), la hipotermia, la atrofia muscular y diferentes tipos de trastornos metabólicos que pueden poner en peligro la vida. Para identificar dianas diagnósticas, pronósticas o terapéuticas, las diversas biomoléculas que están reguladas en el estrés por HA deben estudiarse de manera integral. Con este objetivo, HighAltitudeOmicsDB proporciona un recurso integral de referencia rápida de estudios de expresión de genes y proteínas asociados con condiciones de gran altitud. Contiene información de alrededor de ~ 1300 asociaciones de proteínas para el metanálisis que atiende no solo enfermedades asociadas a la gran altitud, sino también condiciones extremas similares como el estrés por frío. La búsqueda ayuda al usuario a filtrar los datos en función de características únicas y combinadas. El usuario puede elegir características que estén directamente asociadas con la gran altitud o indirectamente. La búsqueda combinada ayuda a extraer conjuntos de datos específicos y ayuda a reducir la estocasticidad de los datos. Todas estas características aumentan las posibilidades de una revisión sistemática y un metanálisis completos. El recurso web no es solo un depósito de proteínas específico de HA; puede realizar un análisis único que puede ayudar a comparar y analizar datos genómicos/transcriptómicos/proteómicos. La base de datos proporciona interacciones de red PPI de cada proteína con sus 50 principales socios que interactúan. Se ha encontrado que estas redes PPI son útiles para iluminar los mecanismos funcionales de las anomalías en condiciones HA32,33,34. HighAltitudeOmicsDB podría acelerar la identificación del descubrimiento de biomarcadores a través del análisis de matriz de similitud semántica de genes. Los informes de la literatura demuestran que la similitud semántica es una herramienta importante para la identificación de biomarcadores, especialmente a gran altitud35.

HighAltitudeOmicsDB es un recurso interactivo y una plataforma de servidor que captura y organiza el conocimiento de los genes/proteínas asociados con el estrés por HA. Proporciona una visión completa de diferentes estudios relacionados con HA; ofrece las anotaciones y la visualización de redes PPI y similitudes semánticas asociadas con genes/proteínas en la base de datos. HighAltitudeOmicsDB es el primer depósito de recursos completos y seleccionados manualmente de genes/proteínas de HA expresados ​​diferencialmente que se obtuvieron mediante minería de texto y una amplia encuesta bibliográfica. La información permite al usuario buscar biomoléculas en función de diferentes filtros de consulta en la base de datos, es decir, nivel de expresión; duración del experimento; altitud y organismo fuente. HighAltitudeOmicsDB también abarca información asociada a proteínas, como la regulación de TF y miARN, asociación proteína-enfermedad, asociación proteína-fármaco. Por lo tanto, la base de información de HighAltitudeOmicsDB es muy grande y facilita el uso de esta información para diseñar experimentos dirigidos para la validación. HighAltitudeOmicsDB también identifica los PPI para cada proteína en la base de datos y calcula la similitud semántica GO entre ellos. Esta característica única ayuda a identificar centros específicos de proteínas que interactúan relacionadas con el estrés de HA. El análisis de las redes y similitudes de PPI permitiría al usuario inferir información mecánica durante HA estrés. El servidor web también ofrece correlación funcional de proteínas. La correlación funcional incluye tanto el enriquecimiento GO como el enriquecimiento de la vía KEGG. Los datos asociados a la proteína se pueden descargar de la base de datos en formato Excel/PDF para su posterior análisis.

Los datos en la base de datos (representados como tablas) se pueden descargar fácilmente en formato Excel/CSV en el servidor web. Cualquier conjunto de datos adicional utilizado y/o analizado durante el estudio actual estará disponible del autor correspondiente a pedido razonable.

Simonson, TS Adaptación a la altitud: un vistazo a través de varios lentes. Alta Alt. Medicina. Biol. 16(2), 125–137 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Basnyat, B. & Murdoch, DR Mal de altura. Lancet 361 (9373), 1967–1974 (2003).

Artículo PubMed Google Académico

Ahmad, Y. et al. Una idea de los cambios en el proteoma del plasma humano en la adaptación a la hipoxia hipobárica. PLoS ONE 8(7), e67548 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, C. et al. Exploración de proteínas de fase aguda y citocinas inflamatorias en el diagnóstico temprano del mal de montaña agudo. Alta Alt. Medicina. Biol. 19(2), 170–177 (2018).

Artículo CAS PubMed Google Académico

Sliwicka, E. et al. Niveles séricos de irisina y miostatina después de 2 semanas de escalada a gran altura. PLoS ONE 12(7), e0181259 (2017).

Artículo PubMed PubMed Central Google Académico

Ahmad, Y. et al. Identificación de haptoglobina y apolipoproteína AI como biomarcadores de edema pulmonar de altura. Integración de funciones genoma 11(3), 407–417 (2011).

Artículo CAS Google Académico

Sharma, M., Singh, SB y Sarkar, S. El análisis de expresión amplia del genoma sugiere una perturbación de la homeostasis vascular durante el edema pulmonar a gran altura. PLoS ONE 9(1), e85902 (2014).

Artículo PubMed PubMed Central Google Académico

Gaur, P. et al. El análisis del transcriptoma temporal sugiere la modulación de múltiples vías y redes de genes involucradas en la interacción célula-célula durante la fase temprana de exposición a gran altitud. PLoS ONE 15(9), e0238117 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Fiorini, N., Lipman, DJ y Lu, Z. Hacia PubMed 2.0. Elife 6, e28801 (2017).

Artículo PubMed PubMed Central Google Académico

Fejes, AP, Jones, MJ & Kobor, MS DaVIE: Base de datos para la visualización e integración de datos epigenéticos. Geneta delantera. 5, 325 (2014).

Artículo PubMed PubMed Central Google Académico

Pundir, S. et al. Herramientas UniProt. actual Protocolo Bioinformar. 53, 1 29 1-1 29 15 (2016).

Artículo Google Académico

Bairoch, A. La base de datos ENZYME en 2000. Nucleic Acids Res. 28(1), 304–305 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Finn, RD et al. Pfam: La base de datos de familias de proteínas. Nucleic Acids Res 42 (edición de la base de datos), D222–D230 (2014).

Artículo CAS PubMed Google Académico

Berman, HM et al. El banco de datos de proteínas. Ácidos nucleicos Res 28(1), 235–242 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Hunter, S. et al. InterPro: la base de datos de firmas de proteínas integradoras. Nucleic Acids Res 37 (edición de la base de datos), D211–D215 (2009).

Artículo CAS PubMed Google Académico

Smigielski, EM et al. dbSNP: una base de datos de polimorfismos de un solo nucleótido. Ácidos nucleicos Res 28(1), 352–355 (2000).

Artículo CAS PubMed PubMed Central Google Scholar

Dennis, G. Jr. et al. DAVID: Base de datos para anotación, visualización y descubrimiento integrado. Genoma Biol 4(5), P3 (2003).

Artículo PubMed Google Académico

Kanehisa, M. et al. KEGG: Nuevas perspectivas sobre genomas, vías, enfermedades y fármacos. Ácidos nucleicos Res 45(D1), D353–D361 (2017).

Artículo CAS PubMed Google Académico

Von Mering, C. et al. STRING: Una base de datos de asociaciones funcionales predichas entre proteínas. Ácidos Nucleicos Res. 31(1), 258–261 (2003).

Artículo Google Académico

Piñero, J. et al. DisGeNET: una plataforma integral que integra información sobre genes y variantes asociados a enfermedades humanas. Ácidos nucleicos Res 45(D1), D833–D839 (2017).

Artículo CAS PubMed Google Académico

Cotto, KC et al. DGIdb 3.0: Un rediseño y expansión de la base de datos de interacción fármaco-gen. Ácidos nucleicos Res 46(D1), D1068–D1073 (2018).

Artículo CAS PubMed Google Académico

Pesquita, C. Similitud semántica en la ontología génica. Métodos Mol. Biol. 1446, 161–173 (2017).

Artículo CAS PubMed Google Académico

Yu, G. et al. GOSemSim: un paquete R para medir la similitud semántica entre los términos GO y los productos genéticos. Bioinformática 26(7), 976–978 (2010).

Artículo CAS PubMed Google Académico

Rosenthal, SB et al. Visualización de red interactiva en cuadernos Jupyter: visJS2jupyter. Bioinformática 34(1), 126–128 (2018).

Artículo MathSciNet CAS PubMed Google Académico

Binns, D. et al. QuickGO: una herramienta basada en la web para la búsqueda de ontologías genéticas. Bioinformática 25(22), 3045–3046 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Moore, LG Medición de la adaptación a gran altitud. Aplicación J. Fisiol. (1985) 123(5), 1371–1385 (2017).

Artículo CAS PubMed Google Académico

Palmer, BF & Clegg, DJ Ascenso a la altura como método para perder peso: lo bueno y lo malo de la activación del factor inducible por hipoxia. Obesidad (Silver Spring) 22(2), 311–317 (2014).

Artículo PubMed Google Académico

Brown, JM y col. La hipoxia regula el ensamblaje de los cilios en los supresores de Tetrahymena que carecen de un gen de la subunidad de transporte intraflagelar. mol. Biol. Celda 14(8), 3192–3207 (2003).

Artículo CAS PubMed PubMed Central Google Scholar

Scott, GR, Guo, KH y Dawson, NJ La base mitocondrial para la variación adaptativa en el rendimiento aeróbico en ratones ciervos de gran altitud. Integrar compensación Biol. 58(3), 506–518 (2018).

Artículo CAS PubMed Google Académico

Mikus, P. & Zundel, W. COPing con hipoxia. Semin. Desarrollo celular Biol. 16(4–5), 462–473 (2005).

Artículo CAS PubMed PubMed Central Google Scholar

Levett, DZ et al. El papel de los óxidos de nitrógeno en la adaptación humana a la hipoxia. ciencia Rep. 1, 109 (2011).

Artículo PubMed PubMed Central Google Académico

López-Cortés, A. et al. Análisis clínico, genómico y de redes de un paciente ecuatoriano nativo americano de gran altura con insensibilidad congénita al dolor con anhidrosis: reporte de un caso. BMC Med. genoma 13(1), 113 (2020).

Artículo CAS Google Académico

Zhao, Y. et al. Análisis proteómico comparativo de espermatozoides de cerdo tibetano en altitudes altas y bajas. Genoma BMC. 20(1), 569 (2019).

Artículo Google Académico

Xin, J. et al. Paisaje de accesibilidad de la cromatina y red reguladora de la adaptación a la hipoxia a gran altitud. Nat. común 11(1), 4928 (2020).

Artículo MathSciNet CAS PubMed PubMed Central Google Scholar

Ahmad, Y. et al. El proteoma del pulmón hipóxico inducido por la hipobárica: conocimientos del perfil proteómico temporal para el descubrimiento de biomarcadores. ciencia Rep. 5, 10681 (2015).

Artículo PubMed PubMed Central Google Académico

Descargar referencias

Agradecemos a la Sra. Shikha Jain, la Sra. Ruchi, la Sra. Jaspreet, la Sra. Avinksha Kathpalia y la Sra. Radhika por su ayuda en la recopilación de datos.

Instituto de Defensa de Fisiología y Ciencias Afines, Lucknow Road, Timarpur, Nueva Delhi, 110054, India

Apoorv Gupta, Sandhya Pathak, Rajeev Varshney, Yasmin Ahmad y Pankaj Khurana

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

AG, PK y RV conceptualizaron la idea. AG y PK seleccionaron los datos. PK diseñó las funcionalidades y curó las redes. SP seleccionó las similitudes semánticas. AG y PK escribieron y revisaron el manuscrito.

Correspondencia a Pankaj Khurana.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Gupta, A., Pathak, S., Varshney, R. et al. HighAltitudeOmicsDB, un recurso integrado para genes y proteínas asociados a gran altitud, redes y similitudes semánticas. Informe científico 13, 9307 (2023). https://doi.org/10.1038/s41598-023-35792-3

Descargar cita

Recibido: 23 julio 2021

Aceptado: 24 de mayo de 2023

Publicado: 08 junio 2023

DOI: https://doi.org/10.1038/s41598-023-35792-3

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.