Como começar na Bioinformática?

A Bioinformática é um campo interdisciplinar que desenvolve métodos e ferramentas de software para entender dados biológicos, especialmente quando os conjuntos de dados são grandes e complexos. As características destes profissionais são as mais diversas possíveis, e acaba dificultando, de certa maneira, a maneira de começar a imersão neste campo. Hoje vou contar a minha visão de como se tornar um(a) BIOIFORMATA a partir de duas áreas: vindo da ciências exatas e vindo das ciências biológicas.

Bem, existem muitos campos da Bioinformática e n ferramentas possíveis para se utilizar durante suas análises. Me lembro quando comecei na bioinformática, em meados de 2011, vindo da matemática. Eu sabia que precisava me inteirar nos assuntos das discussões dos meus chefes e então comecei a executar algo que faço até hoje e me ajudou demais:

  1. LER INTRODUÇÃO DE ARTIGOS
  2. LER E TESTAR SOFTWARES E PIPELINES DO MATERIAL E MÉTODOS

Estas duas ações me ajudaram muito a crescer, principalmente a número (1), pois ela faz citações de outros artigos da área e acaba virando uma cascata de conhecimento absurda. A número (2) acaba sendo essencial para análises posteriores.

Agora vamos dar início as dicas para as pessoas com perfis diferentes que procuraram este post. Dado o seu perfil inicial na área, siga a dica correspondente. VEJA AS DICAS NO FINAL DESTE POST!

1. PERFIL DE CIÊNCIAS EXATAS

Os iniciantes no ramo da bioinformática oriundos de cursos de exatas, como Ciência da Computação, Matemática, Física ou Engenharias, tendem a ter mais dificuldade em temas relacionados a biologia. Mas, devem usar a capacidade de já ter tido contato com algoritmos e linguagens de programação para se aperfeiçoar, então, segurem as dicas.

1.1 Introdução de artigos

Como mencionado, ler as introduções de vários artigos da área de estudo de interesse te trás uma grande bagagem. Inclusive busque os artigos que as introduções citam. Uma das principais motivações para alguém da exatas é saber onde aplicar seu conhecimento na área de biológicas. Os softwares de bioinformática, por exemplo, introduzem o problema que querem solucionar.

1.2 Leiam revisões

As revisões ajudam DEMAIS a entender os estados atuais das áreas de pesquisas. Pergunte ao seu orientador sobre revisões atuais, se não, busque no Google Schoolar por palavras chaves.

1.3 Se aperfeiçoe em linguagens de programação

Chega um momento que estudantes e profissionais de exatas terão que desenvolver pacotes ou softwares de bioinfomática e necessitarão de muita especialidade, principalmente para paralelização e web. Além disso, integrar resultados e realizar pipelines é essencial, logo, precisa de uma habilidade nestes aspectos.

Na bioinformática existe uma tendência de alta na utilização do Python e R para análises mais complexas, mas não que Perl, C++ ou MATLAB não deixem de contribuir com pacotes e softwares sensacionais!

1.4 Aprenda gerenciamento de processos e servidores

Esta dica cabe tanto para os dois perfis discutidos neste post. Saber gerenciar processos em um servidor é essencial para análises mais robustas e que necessitem de paralelização. Quem nunca teve que reiniciar um servidor, verificar uma fila de processos, observar os verboses, utilizar GPUs, alterar permissões e matar o processo baleia do amiguinho?

1.5 Seminários e livros de genética e biologia molecular

Importante destacar que a imersão nos temas de bioinformática necessitam entender o que acontece dentro da célula. Livros de Genética e Biomol trazem conceitos básicos e importantes sobre o porque executar tal ferramenta em determinado aspecto. Por exemplo, a diferença no tratamento de montadores de genomas e transcriptomas devido ao tipo de dado que cada um recebe como entrada. Os seminários em si são essenciais para conhecer rotinas de pesquisa na área de genética, além de promover uma imersão com o grupo. Meu orientador do doutorado sempre dizia que “Seminários é o momento onde se tem a interação do laboratório e integração de habilidades, logo, ele é essencial”.

1.6 Leia os papers dos softwares que você utiliza

Uma das grandes habilidades que vejo em mim é tentar ensinar as aplicações de forma mais clara. Entender o processo por trás do software e não apenas apertar um botão, faz com que você consiga interpretar e explicar ele com mais facilidade. Vindo da área de exatas, a todo momento você, estudante ou profissional, teve contato com manuais e afins. Logo, a tendência é maior de saber lidar com manuais e artigos de softwares, assim, tente entendê-los mais a fundo e repasse o conhecimento.

1.7 Pergunte porquês e “ondes”

Porque realizar tal análise? Porque o mecanismo é este? Porque não executar um pipeline assim? Porque o experimento é desta maneira? Onde queremos chegar? Onde posso começar? Onde posso buscar?

Se questionar quando não entender os procedimentos biológicos te trás uma maior bagagem sobre o que está acontecendo a sua volta e onde você pode ajudar. Não tenha medo.

1.8 Realize cursos de bioinformática

Existem muitos cursos de bioinformática, canais do Youtube, blogs (este!), entre outros, que tratam sobre assuntos de bioinformática e trazem visões diferentes de problemas abordados por diversas áreas. Um curso de bioinformática te trás tanta bagagem que se torna incrível como você muda visões a respeito da área. Os problemas que podem ser resolvidos através da bioinformática são inúmeros e é o a faz ser tão essencial.

Dicas de canais e afins no final deste post.

1.9 Não deixe os algoritmos morrerem

Algoritmos estão em toda a parte da bioinformática, e são uma pitada de elegância nesta área. Pessoas vindas da computação e afins se esbarram com eles a todo momento, logo, tragam eles para seu dia-a-dia. Análise de algoritmos e heurísticas são disciplinas importantes para se elaborar e solucionar problemas complexos da área e não merecem ser deixados de lado! Se transforme em um Biologista Computacional de sucesso (diferenças com bioinformática serão tratados em outro post!).

1.10 Resolva problemas do Rosalind

Resolver problemas iniciais na bioinformática é o primeiro grande passo. Então sugiro que gaste um tempo solvendo problemas do Rosalind, plataforma única para aprender bioinformática e programação através da resolução de problemas.

Link: http://rosalind.info/problems/list-view/

1.11 Aprenda a gerenciar banco de dados

Esse requisito inclui bancos de dados relacionais tradicionais que são a base do SQL (por exemplo, SQL Server e Oracle). Você também deve conhecer os bancos de dados NoSQL que não são relacionais, distribuídos, de código aberto e escalonáveis horizontalmente (por exemplo, MongoDB). Por fim, existem bancos de dados de big data (por exemplo, TCGA) e bancos de dados de análise de big data (por exemplo, Vertica) sobre os quais você deve aprender.

2. PERFIL DE CIÊNCIAS BIOLÓGICAS

Você, pesquisador(a) ou estudante, oriundo de cursos de biológicas, como Biologia, Medicina, Biomedicina e afins, necessita de uma atenção maior em adquirir habilidade computacionais, e as dicas estarão neste post!

2.1 Aprenda Lógica Computacional

Você, teoricamente, nunca teve contato com lógica computacional ao longo da graduação, logo, chegou o momento para ser introduzida a você. Como elaborar um algoritmo, e ferramentas para solucioná-lo é a principal necessidade aqui. Com esta habilidade, você poderá abordar problemas mais complexos e se utilizar da lógica para resolvê-los!

2.2 Aprenda uma linguagem de programação

Saber programar é a habilidade que te fornece autonomia na bioinformática. Não deixe seu medo de informática te bloquear, siga em frente! A programação vai te ajudar a estruturar algoritmos e solucionar problemas. Aposto que será a melhor porta a ser aberta em toda sua vida! Muitas escolas inclusive estão colocando programação como grade básica, já que ela estará presente em toda sociedade nos próximos anos! Se quiser começar, sugiro o Python, Perl, C++ ou R.

Links de cursos no final do post!

2.3 Realize cursos de bioinformática

Existem muitos cursos de bioinformática, canais do Youtube, blogs (este!), entre outros, que tratam sobre assuntos de bioinformática e trazem visões diferentes de problemas abordados por diversas áreas. Um curso de bioinformática te trás tanta bagagem que se torna incrível como você muda visões a respeito da área. Os problemas que podem ser resolvidos através da bioinformática são inúmeros, e é o que a faz ser tão essencial.

Dicas de canais e afins no final deste post.

2.4 Leia revisões

As revisões ajudam DEMAIS a entender os estados atuais das áreas de pesquisas. Pergunte ao seu orientador sobre revisões atuais, se não, busque no Google Schoolar por palavras chaves.

Revisões mais profundas de análises e pipelines auxiliam demais quem não está acostumado a utilizar programas para análises de bioinfo.

2.5 Aumente sua capacidade biológica sobre sua pesquisa

Você tem habilidades em biologia que alguém vindo de exatas não tem, então, use isto a seu favor. Leia bastante sobre o tema, e busque a dica da leitura das introduções, no mais, seja curioso(a).

2.6 Aprenda Linux

Os sistemas computacionais na bioinformática são, em sua imensa maioria, todos vinculados a alguma distribuição do GNU. Seja ele Ubuntu, Fedora, CentOS, entre outros. Você criará uma habilidade realmente necessária para não acabar deletando análises sem querer ou criando pastas desnecessárias. Seja parte do time do MKDIR. Não economize no tempo gasto nesta dica. Não se esqueça de aprender Bash! Automatize seus scripts!

2.7 Teste pipelines

Uma grande diferença é se aventurar e acabar se esbarrando em dificuldades. Mas, primeiro, tente se aventurar! Vários pipelines na bioinformática já estão pré estabelecidos, e basta você os executar para alcançar sua análise. Mas aqui vai uma dica: não seja a pessoa que aperta somente o botão. Sempre busque saber o que está acontecendo em cada parte e porque!

2.8 Resolva problemas do Rosalind

Resolver problemas iniciais na bioinformática é o primeiro grande passo. Então sugiro que gaste um tempo solvendo problemas do Rosalind, plataforma única para aprender bioinformática e programação através da resolução de problemas. Mas antes não se esqueça do passo 2.1 e 2.2 !
Link: http://rosalind.info/problems/list-view/

2.9 Aprenda algoritmos a fundo

Algoritmos é uma ferramenta essencial para se equilibrar com problemas complexos na bioinformática, e te faz um pesquisador(a) mais consolidado(a) em saber criticar e comprar programas e metodologias. Existem livros diversos de análise de algoritmos, e então, comece a lê-los.

2.10 Aprenda estatística

Essa dica serve para os dois perfis em questão deste post. Saber aplicar a estatística correta em seus dados é essencial, e softwares podem te ajudar neste momento, como o SPSS e o SAS, além das análises em R.

HABILIDADES GERAIS: [1][2]
  • Habilidades em bioinformática :
  1. Ferramentas de alinhamento de sequência, como Blast ou Bowtie.
  2. O Genome Analysis Toolkit (GATK).
  3. Software para sequenciamento NGS, microarray, qPCR e análise de dados.
  4. Ferramentas para lidar com dados de sequenciamento, como o samtools.
  5. Para obter conjuntos de dados genéticos, use uma ferramenta como o Ensembl.
  6. Ferramentas para sistemas de busca de banco de dados, como o Entrez.
  • Mineração de dados e aprendizado de máquina:

Técnicas de aprendizado, como cluster hierárquico e árvores de decisão, também são úteis.

  • Habilidades Gerais:

Existem habilidades adicionais importantes, como multitarefa, independência, boas habilidades de comunicação, curiosidade, raciocínio analítico e habilidades gerenciais.

  • Conhecimento em biologia :

Esse requisito varia de acordo com o seu domínio de estudo ou o trabalho específico ao qual você está se candidatando. Você provavelmente precisará de conhecimentos sobre biologia molecular, genética, biologia do câncer e / ou biologia moderna.

  • Habilidades estatísticas

a) Sistemas de software estatístico como SPSS e SAS.

b)  Como fazer análises estatísticas com Python ou R.

  • Habilidades de programação

a) Uma ou mais destas linguagens de programação: R, Perl, Python, Java e Matlab.

b) Ferramentas e bibliotecas de aprendizado de máquina, como Mllib e Scikit-Learn em python, são muito úteis para aprender.

Dicas de cursos, livros e afins

Cursos:

1. EMBL-EBI treinamentos:  https://www.ebi.ac.uk/training/online/

2. Biologia Molecular: http://www.lsic.ucla.edu/ls3/tutorials/

3. Perl – Tutorial: https://www.perl.org/books/library.html#beginningperl

4. Aprenda Perl em 21 dias: http://wwwacs.gantep.edu.tr/docs/perl-ebook/

5. Curso em vídeo – Python : https://bit.ly/3fPjx1H

6. Cursos de R:  https://scholar.harvard.edu/dromney/online-resources-learning-r

7. Cursos de R – Video:  https://bit.ly/2WGLqBR

8. Machine learning:  https://bit.ly/3fSjIts

9. CookBook em R:  https://rc2e.com/

10. Real Python – Cursos:  https://realpython.com/start-here/

11. Scripts em Shell – Linux: https://bit.ly/3fVn9zC

12. Curso de Linux COMPLETO: https://bit.ly/32BVIXE

13. Curso verão Bioinfo – USP: https://curso-verao-bioinfo.ime.usp.br/sobre

14. Curso LacTAD Bioinfo – UNICAMP: https://www.lactad.unicamp.br/

15. Cursos de Bioinfo em geral: https://www.classcentral.com/subject/bioinformatics

Canais Youtube:

1. Online Bioinfo (Profa. Dra. Raquel Minardi):  https://bit.ly/2OJpcL9

2. MIT – Introdução a Biol. Comp.: https://bit.ly/2BnMV0i

3. MIT – CompBio: https://bit.ly/2OMwHkd

Livros:

1. Algoritmos: Teoria e Prática. Cormen (Cormen, T. H., Leiserson, C. E., Rivest, R. L., & Stein, C. (2002). Algoritmos: teoria e prática. Editora Campus, 2, 296.).

2. Bioinformatics for Dummies.  (Claverie, J. M., & Notredame, C. (2006). Bioinformatics for dummies. John Wiley & Sons.)

3. Introdução à bioinformática. Arthur Lesk. (Lesk, A. M. (2008). Introdução à bioinformática. Artmed.)

4. Bioinformatics Algorithms: An Active Learning Approach. (Compeau, P., & Pevzner, P. A. (2018). Bioinformatics Algorithms: An Active Learning Approach. La Jolla. CA: Active Learning Publishers)

5. Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques, Tools, and Applications (Siddesh, G. M. (2020). Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques, Tools, and Applications. Springer Nature.)

6. Material didático da UFRGS de Biologia Molecular: http://www.ufrgs.br/depbiot/discipl/linksHBF/MatDidat.htm

7. Fundamentos matemáticos para Ciência da Computação: https://www.cin.ufpe.br/~dmd/inf101/biblio/FMCCJK.pdf

Espero que todos tenham gostados da dica de como iniciar na Bioinformática e como se tornar um/uma BIOINFORMATA. Me digam suas experiências e outras dicas nos comentários!

Referências

[1] Welch, L., Lewitter, F., Schwartz, R., Brooksbank, C., Radivojac, P., Gaeta, B., & Schneider, M. V. (2014). Bioinformatics curriculum guidelines: toward a definition of core competencies. PLoS Comput Biol, 10(3), e1003496.

[2] Wu, H., & Palani, A. (2015, October). Bioinformatics curriculum development and skill sets for bioinformaticians. In 2015 IEEE Frontiers in Education Conference (FIE) (pp. 1-7). IEEE.

Adicionar aos favoritos o Link permanente.

Sobre Lucas Miguel

Bacharel em Matemática Aplicada e Computacional, mestre em Ciência da Computação pela UNICAMP, e doutor em Bioinformática pela mesma universidade, atualmente é pós-doutorando em Bioinformática no CEPID/CCES - Centro de Engenharia e Ciências Computacionais. Possui como linha de pesquisa integração de ômicas e simulação metabólica.

2 respostas para Como começar na Bioinformática?

  1. Enderson Junior diz:

    Excelente artigo!!! Estou começando a me interessar por essa área.

  2. Olá Lucas Miguel! Passando pra dizer que adorei ler o seu post, e ele me motivou ainda mais a me aprofundar na área e perder o meu “medo”/trauma de Bioinformática (kkkk) … 🙂 Sou estudante de Biotecnologia da PUC-PR, e embora tenha tido as disciplinas de Informática Aplicada e Bioinformática com professores muito feras na área (o que eu já acho um bônus na grade do curso ter essas disciplinas), passei por bons bocados nestas duas disciplinas pra tentar entendê-las e aprendê-las 🙁 , e ainda por cima, enquanto estava cursando estas disciplinas, passei por um período bem tenso da minha vida, então sinto que isso prejudicou muito no meu aproveitamento e absorção de todo o conteúdo ministrado 🙁 … Mas bom, decidi não desistir, seu post me motivou mais kkkkk Outra coisa é que, como eu tenho muito interesse pela área de biologia molecular, genética, genômica afins, técnicas em biologia molecular, NGS, saber sobre bioinformática ja é quase que imprescindível, não é mesmo? kkkk. Anyway, depois do desabafo (kkk) adorei o post mais uma vez, e continuem com boas postagens no blog, como essa 🙂 Obrigada.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *