{"id":1101,"date":"2019-12-18T18:00:47","date_gmt":"2019-12-18T21:00:47","guid":{"rendered":"https:\/\/www.blogs.unicamp.br\/musicologia\/?p=1101"},"modified":"2019-12-17T23:01:46","modified_gmt":"2019-12-18T02:01:46","slug":"41","status":"publish","type":"post","link":"https:\/\/www.blogs.unicamp.br\/musicologia\/2019\/12\/18\/41\/","title":{"rendered":"Intelig\u00eancia artificial e criatividade musical"},"content":{"rendered":"<p><strong>Parte 2<\/strong><\/p>\n<p style=\"text-align: right\">Jos\u00e9 Fornari (Tuti) \u2013 18 de dezembro de 2019<\/p>\n<p style=\"text-align: right\"><em>fornari @ unicamp . br<\/em><\/p>\n<hr \/>\n<p>No artigo anterior falei rapidamente sobre as bases da pesquisa atal em intelig\u00eancia artificial e como as recentes t\u00e9cnicas de aprendizado profundo (<i>Deep Learning<\/i>, ou simplesmente DL) trouxeram recentemente (na \u00faltima d\u00e9cada) um novo alento no processo de cria\u00e7\u00e3o art\u00edstica artificial. Desses t\u00e9cnicas, uma que se destaca \u00e9 chamada de GAN, sigla que significa <i>Generative Adversarial Network<\/i>. A ideia por traz desta t\u00e9cnica \u00e9 utilizar 2 redes neurais artificiais de aprendizagem profunda, uma para gerar e outra pra selecionar. GAN s\u00e3o normalmente traduzidas para o Portugues como \u201credes advers\u00e1rias generativas\u201d, ou \u201credes advers\u00e1rias geradoras\u201d. Muitas refer\u00eancias sobre GAN dizem que as duas redes (ANN) componentes de uma GAN s\u00e3o colocadas como advers\u00e1rias, de modo a competirem na produ\u00e7\u00e3o de imita\u00e7\u00e3o de um padr\u00e3o de dados gen\u00e9ricos. Para mim, a arquitetura da GAN parece muito mais uma forma de coopera\u00e7\u00e3o do que competi\u00e7\u00e3o artificial. Como disse no artigo anterior, as 2 categorias de problemas onde mais se utilizam ANN \u00e9: 1) classifica\u00e7\u00e3o (identificar um padr\u00e3o nos dado apresentados) e predi\u00e7\u00e3o (criar um padr\u00e3o baseado nos dados apresentados). Na GAN uma rede \u00e9 treinada pra detectar um certo padr\u00e3o (por exemplo, a imagem de um rosto humano). A outra rede \u00e9 treinada pra gerar novos padr\u00f5es, baseado em dados apresentados (por exemplo, gerar um rosto humano artificial original, diferente de todos os outros apresentados durante a fase de treinamento). Chamando a solu\u00e7\u00e3o de cada rede de \u201ccandidato\u201d (no caso, rosto humano), enquanto uma rede reproduz candidatos, a outra seleciona apenas os melhores (no caso, os rostos artificiais mais realistas). Este processo se parece muito com o modelo evolutivo de criatividade, que mencionei no artigo <a href=\"https:\/\/www.blogs.unicamp.br\/musicologia\/2019\/12\/09\/39\/\" target=\"_blank\" rel=\"noopener noreferrer\">anterior<\/a>\u00a0onde uma rede age como o processo de reprodu\u00e7\u00e3o e a outra como o processo de sele\u00e7\u00e3o. O resultado \u00e9 impressionante. No final de 2018 pesquisadores da empresa <a href=\"https:\/\/www.nvidia.com\" target=\"_blank\" rel=\"noopener noreferrer\">Nvidia<\/a> apresentaram o StyleGAN, um modelo de gera\u00e7\u00e3o de fotografias de rostos humanos artificiais hiperrealistas (imposs\u00edvel de ser distinguidos da fotografia de um rosto verdadeiro). Em fevereiro de 2019 este modelo foi publicamente disponibilizado como c\u00f3digo livre onde Phillip Wang lan\u00e7\u00f8u um site que gera constantemente rostos de pessoas que nunca existiram. O site se chama <a href=\"https:\/\/thispersondoesnotexist.com\/\">https:\/\/thispersondoesnotexist.com<\/a><\/p>\n<div id=\"attachment_1103\" style=\"width: 710px\" class=\"wp-caption aligncenter\"><img fetchpriority=\"high\" decoding=\"async\" aria-describedby=\"caption-attachment-1103\" class=\"wp-image-1103 size-full\" src=\"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-content\/uploads\/sites\/182\/2019\/12\/tpde.jpg\" alt=\"\" width=\"700\" height=\"934\" srcset=\"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-content\/uploads\/sites\/182\/2019\/12\/tpde.jpg 700w, https:\/\/www.blogs.unicamp.br\/musicologia\/wp-content\/uploads\/sites\/182\/2019\/12\/tpde-225x300.jpg 225w, https:\/\/www.blogs.unicamp.br\/musicologia\/wp-content\/uploads\/sites\/182\/2019\/12\/tpde-525x700.jpg 525w\" sizes=\"(max-width: 700px) 100vw, 700px\" \/><p id=\"caption-attachment-1103\" class=\"wp-caption-text\">Nenhuma destas pessoas existem. Elas foram geradas por um modelo GAN. Fonte: https:\/\/9gag.com\/gag\/amBWoVv\/those-people-doesnt-exist-they-are-generated-by-ai-artificial-intelligence<\/p><\/div>\n<p>Estes modelos de DL avan\u00e7aram para a produ\u00e7\u00e3o de videos e j\u00e1 permitem criar montagens t\u00e3o realistas que s\u00e3o imposs\u00edveis de serem desmascaradas como sendo falsas. Isto criou o termo <em>Deepfake<\/em> (profundamente falso) que \u00e9 um tema bastante pol\u00eamico e potencialmente destrutivo, onde n\u00e3o se pode mais confiar em nossos sentidos para se saber se uma imagem ou video \u00e9 verdadeiro ou falso. Segue abaixo um video de <em>deepfake<\/em> intencional, onde os 2 maiores oponentes no parlamento brit\u00e2nico s\u00e3o colocados como \u00a0que pedindo para que o p\u00fablico vote em seu oponente e ao final confessam ser apenas montagens computacionais de <em>deepfake<\/em>.<\/p>\n<p><iframe title=\"Jeremy Corbyn urges voters to back Boris Johnson for Prime Minister in disturbing deepfake video\" width=\"700\" height=\"394\" src=\"https:\/\/www.youtube.com\/embed\/EkfnjAeHFAk?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe><\/p>\n<p>Tenho percebido um esfor\u00e7o estrat\u00e9gico de v\u00e1rias frentes da tecnologia no sentido de viabilizar ferramentas para o aprendizado democr\u00e1tico de AI. Al\u00e9m da empresa OpenAI mencionada no artigo anterior, que oferece um tutorial sobre uma varia\u00e7\u00e3o que eles utilizam do DL, o DRL (<span lang=\"en-US\"><i>Deep Reinforced Learning<\/i><\/span>) usado nas composi\u00e7\u00f5es musicais autom\u00e1ticas mencionadas anteriormente, existem muitas outras frentes viabilizando e at\u00e9 fomentando o acesso p\u00fablico ao aprendizado dessa tecnologia e o desenvolvimento desses novos modelos computacionais de AI. A grande maioria destes, s\u00e3o desenvolvidos em programas de linguagens computacionais livres, como o <a href=\"https:\/\/www.python.org\" target=\"_blank\" rel=\"noopener noreferrer\">Python<\/a>, culminando no desenvolvimento de bibliotecas importantes de ML com \u00eanfase em DL, gratuitas e de c\u00f3digo aberto, como <a href=\"https:\/\/www.tensorflow.org\" target=\"_blank\" rel=\"noopener noreferrer\">Tensorflow<\/a>, o ambiente de desenvolvimento online gratuito de AI, o <a href=\"https:\/\/colab.research.google.com\" target=\"_blank\" rel=\"noopener noreferrer\">Google Colab<\/a>, totalmente desenvolvido no ambiente de c\u00f3digo aberto <a href=\"http:\/\/www.jupyter.org\" target=\"_blank\" rel=\"noopener noreferrer\">Jypter<\/a>\u00a0que permite ao usu\u00e1rio programar e executar seus c\u00f3digos online (onde a Google oferece gratuitamente a qualquer usu\u00e1rio tempo de processamento em m\u00e1quina com processadores paralelos, uma vez que os algoritmos de DL costumam exigir muito processamento computacional, acima da capacidade de processadores convencionais, que temos em nossos celulares e computadores). Imagino que haja um grande interesse empresarial por tr\u00e1s deste aparente altruismo de grandes aglomerados como a Nvidia e a Google, mas talvez esta venha a ser uma situa\u00e7\u00e3o onde todos os envolvidos venham a sair ganhando, afinal a AI est\u00e1 agora transpondo barreiras anal\u00edticas e est\u00e9ticas at\u00e9 a pouco tempo inimagin\u00e1veis e o envolvimento humano com esta tecnologia pode rapidamente passar a ser, mais do que um diferencial positivo num curr\u00edculo, uma quest\u00e3o de sobreviv\u00eancia profissional e art\u00edstica.<\/p>\n<p>Fica aqui o questionamento do qu\u00e3o criativa pode ser considerada a atual imita\u00e7\u00e3o de um padr\u00e3o musical por AI, como s\u00e3o as composi\u00e7\u00f5es musicais apresentadas no artigo anterior, tanto da OpenIA como dos modelos supervisionados que completaram este ano as sinfonias inacabadas de Schubert e Beethoven. \u00c9 bom lembrar que o ato de imitar \u00e9 um dos passos necess\u00e1rios ao aprendizado. Uma crian\u00e7a come\u00e7a imitando palavras, frases e maneirismos de seus pais e cuidadores, para depois desenvolver os seus pr\u00f3prios padr\u00f5es, que ir\u00e3o descrever sua \u00fanica e distinta personalidade. Um estudante de composi\u00e7\u00e3o musical inicia estudando e at\u00e9 imitando o estilo de grandes compositores que admira, para depois desenvolver o seu pr\u00f3prio estilo composicional. Talvez estejamos presenciando agora a fase de mimese est\u00e9tica da AI para que depois suas futuras vers\u00f5es cheguem \u00e0 fase da diegese, onde apresentar\u00e3o narrativas originais e \u00fanicas. Conforme mencionado <a href=\"https:\/\/www.blogs.unicamp.br\/musicologia\/2019\/07\/03\/26\/\" target=\"_blank\" rel=\"noopener noreferrer\">anteriormente<\/a> a mimese \u201cmostra sem explicar\u201d enquanto que a diegese \u201cexplica sem mostrar\u201d. De fato, modelos atuais de DL e especialmente GAN realizam a tarefa para a qual foram treinadas \u201csem explicar\u201d, j\u00e1 que, conforme dito no \u00faltimo artigo, \u00e9 imposs\u00edvel saber como a solu\u00e7\u00e3o de DL foi obtida. Quem sabe num futuro pr\u00f3ximo, novas tecnologias de AI ser\u00e3o capazes, como no caso da diegese, de explicar sem a necessidade de mostrar e assim angariar conhecimento sobre as solu\u00e7\u00f5es realizadas. Se isso ocorrer, queira o destino, que estes AI estejam ainda pouco conscientes ou suficientemente benevolentes para compartilharem seus conhecimentos adquiridos com a humanidade.<\/p>\n<p>&nbsp;<\/p>\n<p><strong>Refer\u00eancias:<\/strong><\/p>\n<p><a href=\"https:\/\/p.dw.com\/p\/3UQdb\" target=\"_blank\" rel=\"noopener noreferrer\">\u201cIntelig\u00eancia artificial completa 10\u00aa Sinfonia de Beethoven\u201d Deutsche Welle.<\/a><\/p>\n<p><a href=\"http:\/\/sabahdai.ly\/0eh8dg\" target=\"_blank\" rel=\"noopener noreferrer\">Experts to use AI to finish Beethoven&#8217;s unfinished 10th symphony<\/a><\/p>\n<p><a href=\"https:\/\/www.siliconrepublic.com\/machines\/unfinished-symphony-no-8-ai-huawei\" target=\"_blank\" rel=\"noopener noreferrer\">John Kennedy. How AI completed Schubert\u2019s Unfinished Symphony No 8.<\/a><\/p>\n<p><a href=\"https:\/\/youtu.be\/50CUJB8tPGc\" target=\"_blank\" rel=\"noopener noreferrer\">Is AI stealing our jobs? &#8211; Matthias R\u00f6der (2019).<\/a><\/p>\n<p><a href=\"https:\/\/medium.com\/technology-invention-and-more\/everything-you-need-to-know-about-artificial-neural-networks-57fac18245a1\" target=\"_blank\" rel=\"noopener noreferrer\">Everything You Need to Know About Artificial Neural Networks<\/a><\/p>\n<p><a href=\"https:\/\/cs224d.stanford.edu\/reports\/allenh.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">Allen Huang, Raymond Wu. \u201cDeep Learning for Music\u201d CoRR abs\/1606.04930.<\/a><\/p>\n<p><a href=\"https:\/\/youtu.be\/lUZ2YBOLGsc\" target=\"_blank\" rel=\"noopener noreferrer\">Music Generation using Deep Learning<\/a><\/p>\n<p><a href=\"http:\/\/deeplearningbook.com.br\/as-10-principais-arquiteturas-de-redes-neurais\/\" target=\"_blank\" rel=\"noopener noreferrer\">Deep Learning Book, online em Portugu\u00eas e gratuito.<\/a><\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p><strong>Como citar este artigo:<\/strong><\/p>\n<p>Jos\u00e9 Fornari. \u201cIntelig\u00eancia artificial e criatividade musical \u2013 parte 2\u201d. Blogs de Ci\u00eancia da Universidade Estadual de Campinas. ISSN 2526-6187. Data da publica\u00e7\u00e3o: 09 de dezembro de 2019. Link: https:\/\/www.blogs.unicamp.br\/musicologia\/2019\/12\/18\/41\/<\/p>\n","protected":false},"excerpt":{"rendered":"<a href=\"https:\/\/www.blogs.unicamp.br\/musicologia\/2019\/12\/18\/41\/\" rel=\"bookmark\" title=\"Link permanente Intelig\u00eancia artificial e criatividade musical\"><p>Parte 2 Jos\u00e9 Fornari (Tuti) \u2013 18 de dezembro de 2019 fornari @ unicamp . br No artigo anterior falei rapidamente sobre as bases da pesquisa atal em intelig\u00eancia artificial e como as recentes t\u00e9cnicas de aprendizado profundo (Deep Learning, ou simplesmente DL) trouxeram recentemente (na \u00faltima d\u00e9cada) um novo alento no processo de cria\u00e7\u00e3o [&hellip;]<\/p>\n<\/a>","protected":false},"author":389,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"pgc_sgb_lightbox_settings":"","_vp_format_video_url":"","_vp_image_focal_point":[],"footnotes":""},"categories":[61,8],"tags":[7,10,62,11,14,3,2,15,18,17,13,5],"class_list":{"0":"post-1101","1":"post","2":"type-post","3":"status-publish","4":"format-standard","6":"category-continuacao","7":"category-musicologia","8":"tag-blog","9":"tag-blogs","10":"tag-inteligencia-artificial-e-criatividade-musical","11":"tag-jose-fornari","12":"tag-josefornari","13":"tag-musica","14":"tag-musicologia","15":"tag-musicologia-na-midia","16":"tag-nics","17":"tag-tuti","18":"tag-tutifornari","19":"tag-unicamp","20":"h-entry","21":"hentry"},"jetpack_featured_media_url":"","_links":{"self":[{"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/posts\/1101","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/users\/389"}],"replies":[{"embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/comments?post=1101"}],"version-history":[{"count":3,"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/posts\/1101\/revisions"}],"predecessor-version":[{"id":1105,"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/posts\/1101\/revisions\/1105"}],"wp:attachment":[{"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/media?parent=1101"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/categories?post=1101"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/musicologia\/wp-json\/wp\/v2\/tags?post=1101"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}