{"id":6159,"date":"2025-12-21T12:41:49","date_gmt":"2025-12-21T15:41:49","guid":{"rendered":"https:\/\/www.blogs.unicamp.br\/zero\/?p=6159"},"modified":"2026-01-09T12:31:09","modified_gmt":"2026-01-09T15:31:09","slug":"um-metodo-desonesto-de-defender-a-honestidade-de-dados-desonestos","status":"publish","type":"post","link":"https:\/\/www.blogs.unicamp.br\/zero\/6159\/","title":{"rendered":"Um m\u00e9todo desonesto de defender a honestidade de dados desonestos"},"content":{"rendered":"\n<p class=\" eplus-wrapper\">Uns dois anos atr\u00e1s estava passeando no Amig\u00e3o (esses loj\u00f5es que vendem de tudo) quando encontrei um saquinho de dados de 6 faces na fila do caixa. Dados s\u00e3o legais, uso dados para v\u00e1rias das minhas atividades, mas geralmente preciso surrupiar de algum dos jogos de tabuleiro que tenho, e torcer pra n\u00e3o perder no meio do caos do ambiente did\u00e1tico. Pensando nesse aspecto, fiz algo raro em minha vida, comprar por impulso! Meu impulso de compras parece o cora\u00e7\u00e3o do mestre anci\u00e3o de libra (pra quem pegou a refer\u00eancia, \u00f3timo, quem n\u00e3o pegou&#8230; azar). Enfim, eu com meus dados de proced\u00eancia duvidosa tive muitos momentos felizes nesse per\u00edodo, desde jogos de RPG a experimentos em sala de aula envolvendo probabilidade, sempre que preciso, pego esses dadinhos e saio distribuindo pra atividade. Mas em dois anos de conviv\u00eancia, comecei a suspeitar da honestidade deles, n\u00e3o que eu pudesse provar algo, mas s\u00e3o tantas vezes vendo-os serem lan\u00e7ados que alguns resultados pareciam se repetir mais do que os outros.<\/p>\n\n\n\n<p class=\" eplus-wrapper\">At\u00e9 que essa semana, dando a \u00faltima aula de Estat\u00edstica para o curso t\u00e9cnico de Qu\u00edmica, cheguei em um impasse de terminar 30 minutos mais cedo, passar exerc\u00edcios nesse tempo ou abordar um novo conte\u00fado no tempinho que restava. Pensando que j\u00e1 estamos pra mais que metade de dezembro, pensando rapidamente me veio uma ideia que caberia bem ao t\u00f3pico teste Qui\u00b2 que estavamos encerrando, testar em um contexto emp\u00edrico se um evento \u00e9 ou n\u00e3o aleat\u00f3rio. T\u00e3o logo tive essa ideia, passei para a turma em grupos, meus dadinhos duvidosos, pedindo que lan\u00e7assem e registrassem a quantidade de cada resultado (1, 2, 3, 4, 5, 6) at\u00e9 que todos eles tivessem pelo menos 5 ocorr\u00eancias. Pensei seriamente em pedir que cada resultado ocorresse pelo menos 10 vezes, mas fiquei com d\u00f3 da turma&#8230;<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Ent\u00e3o o c\u00e1lculo era simples, ap\u00f3s obter os resultados bastaria calcular o Qui^2 e comparar com a tabela usando um n\u00edvel de signific\u00e2ncia escolhido (no caso, pedi 0,05).<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Qui^2 = somat\u00f3rio (i = 1, 6) Xi*[(i &#8211; Ei)^2]\/Ei. Onde Xi s\u00e3o as frequ\u00eancias absolutas de cada resultado do dado (1, 2, 3, 4, 5 ou 6) e Ei \u00e9 o valor esperado para cada resultado.<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Da\u00ed no fluxo da atividade, indo pra l\u00e1 e pra c\u00e1 na sala explicando o que tinha que ser feito, fui de impulso explica do como calcular o Ei, sendo a m\u00e9dia dos resultados para cada um dos valores encontrados. Como estamos testando a aleatoriedade uniforme, o Ei ser\u00e1 igual para todos i, bastaria fazer a m\u00e9dia ponderada dos resultados encontrados.<\/p>\n\n\n\n<p class=\" eplus-wrapper\">E = (X1*1 + X2*2 + X3*3 + X4*4 + X5*5 + X6*6)\/(X1 + X2 + X3 + X4 + X5 + X6).<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Tudo certo, agora s\u00f3 precisava esperar que meus alunos provassem que meus dados era desonestos&#8230; Mas eles foram me entregando relat\u00f3rios que diziam que meus dados eram honestos. Isso me deixou cheia de trigo (intrigada)&#8230; Ser\u00e1 que meus dados eram honestos? E eu aqui injustamente duvidando de sua honestidade? Enfim, comecei a escrever esse texto contando a hist\u00f3ria pois achei que seria legal narrar est\u00e1 experi\u00eancia&#8230; Mas em meio ao texto germinando (de tanto trigo que eu carregava) achei o erro, e de fato, \u00e9 um erro sutil, voc\u00ea conseguiu encontrar enquanto lia o texto?<\/p>\n\n\n\n<p class=\" eplus-wrapper\">&#8230;<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Quer\u00edamos testar se sua distribui\u00e7\u00e3o de resultados era uniforme, ou seja, o valor esperado E deveria ser a hip\u00f3tese da distribui\u00e7\u00e3o uniforme:<\/p>\n\n\n\n<p class=\" eplus-wrapper\">E = (1 + 2 + 3 + 4 + 5 + 6)\/6 = 3,5<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Com isso, estar\u00edamos de fato comparando se os resultados emp\u00edricos acompanhavam os resultados esperados. Mas em vez disso, fizemos um m\u00e9todo desonesto, pois usamos os pr\u00f3prios valores encontrados nos dados para determinar o valor esperado. Nesse caso, seria como verificar se os dados seguem uma distribui\u00e7\u00e3o dada pelo comportamento do pr\u00f3prio dado, se ele \u00e9 desonesto ou honesto, isso vai sempre funcionar, pois \u00e9 o dado que define o valor a se esperar.<\/p>\n\n\n\n<p class=\" eplus-wrapper\">O interessante \u00e9 que parec\u00edamos estar testando a honestidade do dado, por\u00e9m usando-o como par\u00e2metro. \u00c9 como quis\u00e9ssemos avaliar se um pacote de 1kg de arroz tem de fato 1kg, usando o pr\u00f3prio pacote de arroz como par\u00e2metro para avaliar quanto pesa 1kg.<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Agora com calma, vejo que processo correto \u00e9 bem mais simples, e n\u00e3o envolve o valor esperado 3,5, pois assim, estar\u00edamos comparando os resultados obtidos com a m\u00e9dia fixa, e quanto maior ela fosse o intervalo de valores, maior seria essa dist\u00e2ncia. O correto seria fazermos:<\/p>\n\n\n\n<p class=\" eplus-wrapper\">E = (X1 + X2 + X3 + X4 + X5 + X6)\/6 resulta a quantidade esperada pra cada resultado em rela\u00e7\u00e3o ao total de tentativas realizadas. <\/p>\n\n\n\n<p class=\" eplus-wrapper\">Qui^2 = somat\u00f3rio (i = 1, 6) [(Xi &#8211; E)^2]\/E<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Easy :3<\/p>\n\n\n\n<p class=\" eplus-wrapper\">Esse POST serve de alerta para os riscos de dar atividades sem um planejamento\/estudo pr\u00e9vio, mas tamb\u00e9m a sugest\u00e3o de como erros geram \u00f3timos materiais para divulga\u00e7\u00e3o cient\u00edfica (desde que sejam analisados com criticidade).<\/p>\n\n\n\n<p class=\" eplus-wrapper\"><em>.<\/em><\/p>\n\n\n\n<hr class=\" wp-block-separator has-alpha-channel-opacity eplus-wrapper\" \/>\n\n\n\n<p class=\" eplus-wrapper\">Como referenciar este conte\u00fado em formato ABNT (baseado na norma NBR 6023\/2018):<\/p>\n\n\n\n<p class=\" eplus-wrapper\">SILVA, Marcos Henrique de Paula Dias. Um m\u00e9todo desonesto de defender a honestidade de dados desonestos.\u00a0<em>In<\/em>: UNIVERSIDADE ESTADUAL DE CAMPINAS.\u00a0<strong><a href=\"https:\/\/www.blogs.unicamp.br\/zero\/\" target=\"_blank\" rel=\"noreferrer noopener\">Zero \u2013 Blog de Ci\u00eancia da Unicamp<\/a>.\u00a0<\/strong><a href=\"https:\/\/www.blogs.unicamp.br\/zero\/category\/v-14-ed-1\/\" target=\"_blank\" rel=\"noreferrer noopener\">Volume 14. Ed. 1. 2\u00ba semestre de 2025<\/a>. Campinas, 21 de dezembro de 2025. Dispon\u00edvel em:\u00a0<a href=\"https:\/\/www.blogs.unicamp.br\/zero\/6159\/\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/www.blogs.unicamp.br\/zero\/6159\/<\/a>. Acesso em: &lt;data-de-hoje&gt;.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Uns dois anos atr\u00e1s estava passeando no Amig\u00e3o (esses loj\u00f5es que vendem de tudo) quando encontrei um saquinho de dados<\/p>\n","protected":false},"author":434,"featured_media":6161,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"editor_plus_copied_stylings":"{}","_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"pgc_sgb_lightbox_settings":"","_vp_format_video_url":"","_vp_image_focal_point":[],"footnotes":""},"categories":[1243],"tags":[],"class_list":["post-6159","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-v-14-ed-1"],"_links":{"self":[{"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/posts\/6159","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/users\/434"}],"replies":[{"embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/comments?post=6159"}],"version-history":[{"count":8,"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/posts\/6159\/revisions"}],"predecessor-version":[{"id":6200,"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/posts\/6159\/revisions\/6200"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/media\/6161"}],"wp:attachment":[{"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/media?parent=6159"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/categories?post=6159"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.blogs.unicamp.br\/zero\/wp-json\/wp\/v2\/tags?post=6159"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}