27 October 2016

Olá!

Conseguimos terminar a fiscalização dos códigos QR recebidos da equipe do aplicativo Apura Fácil no primeiro turno! :)

Recebemos um total de 11460 códigos QR, contendo 5813 Boletins de Urna (BU) completos com assinaturas digitais válidas. Conseguimos extrair 306717 resultados desses códigos, devidamente verificados com a base de BUs publicada pelo TSE. A base recebida em 2016 corresponde a aproximadamente 72.5% da base do segundo turno de 2014 verificada pelo projeto.

A única divergência observada foi encontrada na zona 1 e seção eleitoral 813 da cidade de Manaus. A única hipótese plausível que encontramos para explicar o fenômeno é a cerimônia da Votação Paralela:

  • O código QR recebido possui um identificador de urna eletrônica diferente do divulgado no BU oficial.

  • As bases de correspondências esperadas e efetivadas publicadas pelo TSE mostram que 3 urnas em AM foram instaladas na véspera das eleições, incluindo o identificador divulgado no BU oficial. Esse é o tamanho típico da amostra da Votação Paralela.

  • A combinação de zona e seção foi noticiada pela imprensa local como participante da Votação Paralela.

Alguém parece ter capturado o código da urna no final da Votação Paralela, talvez por ingenuidade ou para nos confundir? Geralmente fazem parte desta votação fiscais de partido, representantes da OAB/Ministério Público e técnicos da Justiça Eleitoral. Ressaltamos que a amostra processada não é necessariamente representativa do total, de forma que só podemos atestar a transmissão correta dos resultados dessas seções eleitorais. Por fim, vale sempre lembrar que nossa fiscalização se restringe à transmissão dos resultados, pois o software de votação instalado nas urnas continua inauditável, para todos os propósitos.

Nossos scripts, programas e bases estão publicados.

Integram a equipe desta edição do projeto os alunos Ivan Petrin e Luiz Nachtigall do Instituto de Computação da UNICAMP. Obrigado pela colaboração!

Abraços,
Diego Aranha

Veja também:

Resultado da conferência coletiva dos Boletins de Urna do 2º Turno

Compartilhe no: Facebook | Twitter | Google+


13 March 2016

Prêmios e repercussão internacional

O Projeto Você Fiscal foi premiado em Novembro do ano passado pela edição brasileira da revista MIT Technology Review. O prêmio se chama Inovadores Menores de 35 anos Brasil e participar do evento foi muito interessante para estabelecer colaborações e discutir idéias para a evolução do projeto. Também tivemos a oportunidade de apresentar a iniciativa na conferência Real World Cryptography 2016, com ótima repercussão entre os presentes. Os slides da apresentação podem ser encontrados no site do evento.

Voto Impresso

O voto impresso foi aprovado para reintrodução nas eleições de 2018, após longa tramitação. Um dos pontos negativos do Projeto de Lei aprovado é a ausência de fases de auditoria e recontagem, que poderiam ter sido especificadas. Estamos nos aproximando de pesquisadores internacionais para estudar procedimentos que facilitem a adoção do recurso nas eleições brasileiras.

Código QR e TPS

O TSE anunciou poucos dias após nossa última atualização a introdução de um código QR com assinatura digital nos Boletins de Urna das próximas eleições. Esse recurso deve facilitar em muito a aquisição de dados, pois toda a dificuldade com extração de informação via reconhecimento de caracteres torna-se trivial. O manual com a especificação já foi publicado. Há intenção do projeto continuar em 2016 nesses moldes, agora com foco na qualidade da amostra. É crédito do Você Fiscal demonstrar a clara demanda por mecanismos de fiscalização das eleições por parte da sociedade.

O TSE também realizou a terceira edição dos Testes Públicos de Segurança (TPS) do Sistema Eletrônico de Votação entre os dias 08 e 10 de Março. Estive presente como observador externo indicado pela Sociedade Brasileira de Computação na Comissão Avaliadora e farei uma atualização mais detalhada quando toda a documentação se tornar pública no site do evento, respeitando o protocolo.

Progresso

A auditoria solicitada pelo PSDB no final de 2014 já foi finalizada e o relatório pode ser encontrado na página do Fórum do Voto Eletrônico, junto com um artigo mais curto publicado no II Workshop de Tecnologia Eleitoral. A auditoria considerou uma base menor, porém melhor distribuída, e não encontrou divergências (página 138 do relatório). Os resultados parciais do nosso projeto colaboraram indiretamente com a auditoria.

O processamento continua em ritmo vagaroso. Relembrando:

  • A base do 2o Turno enviada pelo aplicativo está completamente finalizada (7.020 BUs) e não foram encontradas divergências;
  • A base do 1o Turno enviada pelo aplicativo foi pré-processada (7.641 BUs), mas a quantidade de fotos ainda impossibilita uma verificação manual: há seções eleitorais individuais com mais de 50 fotos;
  • Abase do 2o Turno enviada pelo site do projeto (outros 7.200 BUs) impõe dificuldades pela heterogeneidade (fotos com diferentes resoluções, tamanhos, fundos, orientações, etc): nosso código para pré-processamento que confirmou origem de 87.1% dos BUs submetidos pelo aplicativo agora tem acurácia de apenas 12.4%, mesmo após ajustes. Do ponto de vista estatístico, essa última base possui viés e concentração parecidas com a base enviada pelo aplicativo, então o problema de qualidade da amostra ainda persiste.

Considerando toda a informação acima, entendemos ser mais interessante dedicar o tempo disponível ao planejamento da fiscalização das eleições de 2016, pois qualquer técnica desenvolvida perderá utilidade com a introdução dos códigos QR nos Boletins de Urna. Aproveito a oportunidade para agradecer novamente pelo apoio, doações, participação e engajamento da nossa comunidade!

Abraços,
Diego Aranha

Veja também:

Resultado da conferência coletiva dos Boletins de Urna do 2º Turno

Compartilhe no: Facebook | Twitter | Google+


16 June 2015

Conferência coletiva

Conforme publicado anteriormente, os Boletins de Urna submetidos pelo aplicativo Você Fiscal foram processados por análise automática utilizando reconhecimento de caracteres, que permitiu a inspeção e correção de inúmeros erros de preenchimento.

Na ocasião, a extração automática de mais de 20 mil pares de candidato/votação dos Boletins de Urna permitiu conferência com os resultados eletrônicos publicados pelo TSE, onde foi encontrada discrepância em aproximadamente 20% dos pares extraídos. Por uma questão de transparência, resolvemos distribuir o esforço de verificação entre a comunidade, para que as discrepâncias fossem resolvidas coletivamente.

Resultados parciais

Foram recebidos pelo aplicativo Você Fiscal 8.824 conjuntos de fotos referentes ao Segundo Turno das eleições. Eliminando fotos marcadas como inviáveis e seções duplicadas, foram verificadas 7.020 seções eleitorais por conferência manual coletiva, correspondentes a 1.6% das urnas eletrônicas do país e 4.1% dos eleitores (ou 4.644.385 de votos).

Até então, já foram realizadas mais de 25800 conferências, na direção de atingir pelo menos 3 conferências distintas por cada Boletim de Urna submetido. Após a conferência manual coletiva, persistiram 143 Boletins de Urna como divergentes. Nova análise manual desses 143 Boletins de Urna por parte da equipe não apresentou nenhuma discrepância em relação aos resultados publicados pelo TSE. Em alguns poucos casos, a conferência detectou que fotos de Zerésima ou BUs de Primeiro Turno haviam sido submetidas como de Segundo Turno. Vale lembrar que o Você Fiscal analisa apenas a transmissão dos resultados parciais de eleição, não se manifestando sobre qualquer outro componente do sistema de votação eletrônica utilizado em 2014, por simples falta de acesso.

Novidades

Desde nossa última comunicação, várias coisas importantes aconteceram:

  • Um projeto de pesquisa foi submetido para iniciativa de dados abertos da Microsoft. A aprovação do projeto nos concedeu uma bolsa de Iniciação Científica ou Mestrado para que um aluno trabalhe em tempo integral no aprimoramento das técnicas automáticas de reconhecimento de caracteres. Esse passo é fundamental para se explorar o restante da base de dados: as fotos de BUs do Segundo Turno são substancialmente maiores e menos padronizadas, exigindo esforço maior de pré-processamento; as fotos de BUs do Primeiro Turno são muito numerosas devido ao tamanho dos documentos, inviabilizando a conferência manual. A princípio, contar com uma base já validada manualmente de fotos de tamanho expressivo permitirá que o treinamento e ajuste do reconhecimento de caracteres seja mais preciso.

  • Estamos trabalhando há meses com uma equipe reduzida, pois os recursos do projeto foram esgotados ainda em 2014. Nossa prestação de contas já está disponível há alguns dias no site do projeto. Incluímos apenas os custos previstos na campanha de financiamento coletivo, e foram ignorados alguns custos posteriores com armazenamento de dados em nuvem e reenvio de recompensas financiados com recursos próprios.

  • Estamos produzindo um artigo científico detalhando a experiência, suas limitações e resultados parciais. No mesmo artigo, é proposto um mecanismo simples de código de barras para facilitar a verificação de Boletins de Urna com um dispositivo móvel, idéia que surgiu após várias iterações com membros da comunidade. Os resultados desse trabalho deverão ser apresentados na II edição do Workshop de Tecnologia Eleitoral, evento satélite do XV Simpósio Brasileiro em Segurança da Informação e de Sistemas Computacionais.

Apesar da demora e dificuldades na condução do trabalho, esse projeto já é o maior esforço coletivo para auditoria de resultados eleitorais conduzido no mundo! Parabéns e obrigado, não teríamos chegado até aqui sem a colaboração de todos.

Ainda há muito trabalho para que a idéia evolua e se torne mais simples, descentralizada e eficaz, mas acreditamos ter feito progresso importante nessa área e contribuído significativamente para a reinstalação do debate sobre a segurança e a transparência do sistema eletrônico de votação no Brasil.

Abraços,
Diego e Helder

Veja também:

Resultado da análise automática do 2º turno e início da conferência coletiva

Compartilhe no: Facebook | Twitter | Google+


15 December 2014

Análise automática das imagens

A análise foi feita até agora com as imagens enviadas pelo aplicativo Você Fiscal. As fotos enviadas pelo site já estão em pré-processamento.

O primeiro passo da análise automática foi a triagem, com o objetivo de confirmar a origem (zona, zeção, município e Estado) dos Boletins de Urna. Para tanto, utilizamos reconhecimento de caracteres treinado especificamente com a fonte da Urna Eletrônica para detectar o “número de correspondência” de cada Boletim de Urna fotografado e, utilizando base de correspondências efetivadas do TSE, verificar se as informações preenchidas pelo usuário eram compatíveis. Em caso negativo, a intervenção manual permitiu corrigir as informações e anotar o Boletim de Urna corretamente. Caso mesmo a inspeção manual não tenha sido suficiente para confirmar a origem ou caso as fotos não fossem de um Boletim de Urna, a submissão não fez parte da análise.

Em seguida, utilizamos técnicas simples de processamento de imagem (binarização) para aumentar o contraste das imagens nas fotos de Boletins de Urna cuja origem foi confirmada. O reconhecimento de caracteres posterior permitiu extrair as informações das fotos e conferi-las com as disponibilizadas pelo TSE no repositório de dados eleitorais. Essa extração permitiu extrair até agora mais de 20 mil pares de candidato e votação, dos quais aproximadamente 20% não foram compatíveis com a informação do TSE. Resta saber se por erro no reconhecimento de caracteres (mais provável) ou erro/fraude nas eleições.

Para finalizar a tarefa de verificação das submissões do segunto turno, o trabalho restante será distribuído entre usuários voluntários da comunidade, de forma que cada Boletim de Urna será considerado validado após um número mínimo de verificações. Os Boletins de Urna que foram verificados por software também poderão ser verificados pela comunidade, mas contarão com aprovação parcial que acelerará a verificação distribuída.

Participe da conferência coletiva

Quem vota é quem conta. Este é um princípio básico de transparência eleitoral e fiscalização cidadã que o Brasil não segue, mas que estamos juntos trabalhando para mudar. Novamente, precisamos da sua participação.

Auditoria = registro + conferência

No dia das eleições, milhares de cidadãos e cidadãs deram exemplo por todo o país, exigindo mais transparência no processo eleitoral e, através de ação direta, colocando a atuação do governo sob supervisão cidadã (como deveria ser, sempre). Nosso objetivo: registrar evidências.

Mais de 20 mil Boletins de Urna foram fotografados nesta mobilização histórica, mostrando mais uma vez que a sociedade civil é capaz de se organizar e trabalhar junto sim, independente de fronteiras partidárias e rivalidades ideológicas, tanto dentro quanto fora da Internet.

Registrar boletins de urna era possível mesmo antes da existência do projeto Você Fiscal e da publicação do nosso aplicativo. O que fizemos foi trazer o assunto ao debate público e empoderar os eleitores com conhecimento e software para desobstruir e amplificar a capacidade de fiscalização da própria sociedade. O que antes seria um esforço individual isolado pôde, pela primeira vez, contar com a força e o apoio mútuo de uma comunidade de cidadãos mobilizados.


Agora que temos o registro, precisamos fazer a conferência.

Com software, conseguimos fazer uma análise prévia automática, o que aumenta a confiança nos casos em que os números bateram. Mas software é passível de erro (senão não estaríamos exigindo registro impresso do voto), então mesmo os que bateram precisam ser revisados manualmente.

Além destes, porém, em pelo menos 20% dos casos, o número extraído da foto via software não bateu com o resultado oficial do TSE. Estes precisam ser checados com atenção redobrada.

Para que cada um dos BUs analisados seja conferido por pelo menos 3 pessoas diferentes, precisamos de 26.472 checagens. Somos uma equipe de duas pessoas e não conseguiríamos fazer isso sozinhos. Mas mesmo que conseguíssemos, por que alguém deveria confiar na nossa palavra?

A sociedade vota, a sociedade confere, certo? Para facilitar a conferência coletiva, fizemos uma ferramenta em software, assim como fizemos para facilitar o registro coletivo.

Em última instância, a decisão de ter eleições auditáveis e auditadas só pode ser tomada pelos próprios eleitores. Não substituímos o trabalho da sociedade, apenas a equipamos com ferramentas para que tenha maior impacto.

Cada espaço de atuação do governo iluminado por um olhar cidadão é um espaço a menos onde coisas podem ser feitas contra o nosso interesse. Vamos nos unir mais uma vez e manter essa luz acesa?

Por favor, participe clicando abaixo:

Participar da Conferência Coletiva

Obrigado!

Abraços,
Diego e Helder

Dúvidas

Se tiver dúvidas sobre este artigo ou sobre como usar o site de conferência coletiva, por favor, deixe um comentário abaixo para que possamos atualizar este texto com a resposta. Se você souber a resposta de alguma pergunta feita por outra pessoa, por favor, colabore respondendo. Obrigado!

  • Há relatos de usuários do Firefox que tiveram problemas com o site. Estamos investigando mas, enquanto isso, pedimos que usem o Google Chrome.

Veja também:

E se o Você Fiscal não encontrar nenhuma fraude?

Compartilhe no: Facebook | Twitter | Google+


01 November 2014
Obs.: o texto não é do Você Fiscal. Foi retirado daqui. O texto é hospedado em um serviço independente (Genius.com). O Você Fiscal não se responsabiliza pela veracidade de referências ou opiniões de usuários deixadas através deste serviço.

Compartilhe no: Facebook | Twitter | Google+


31 October 2014
Obs.: o texto não é do Você Fiscal. Foi retirado daqui. O texto é hospedado em um serviço independente (Genius.com). O Você Fiscal não se responsabiliza pela veracidade de referências ou opiniões de usuários deixadas através deste serviço.

Compartilhe no: Facebook | Twitter | Google+


30 October 2014

Às 23:59 da terça-feira, 28 de outubro, encerramos o recebimento das imagens que os fiscais de todo o Brasil enviaram através do aplicativo Você Fiscal e pelo site.

A partir de agora, estas imagens seguem para a triagem, extração de informação via reconhecimento de caracteres e conferência.

###Entenda como são analisadas as imagens dos BUs recebidos (relatório parcial do 1º turno)

A base original com os Boletins de Urna do 2º turno enviados através do aplicativo Você Fiscal já está disponível no repositório. Os dados dos BUs são abertos para pesquisa independente e consulta pública. Grupos ou pesquisadores que desejarem fazer sua própria checagem das informações podem utilizá-la ––não queremos confiança cega nem no TSE, nem em nós mesmos.

A partir da base agregada dos Boletins de Urna em formato digital, publicada pelo TSE, será possível realizar a análise automatizada, comparando as informações divulgadas pelo TSE com os BUs enviados pelos fiscais.

Se você deseja conferir individualmente se os dados do BU que fotografou batem com a versão digital publicada pelo TSE, veja como fazê-lo aqui: http://www.vocefiscal.org/vemproBU/#conferencia.

Em breve acrescentaremos ao repositório a base de imagens recebidas pelo site, com mais de 8 mil BUs enviados através do vocefiscal.org/upload. Todo o progresso da análise será divulgado publicamente aqui no blog do Você Fiscal e em nossa página do Facebook.

##Veja também:

Orientação partidária do Você Fiscal: Sobre afirmações feitas pelo Delegado Protógenes Queiroz e outras supostas denúncias

E se o Você Fiscal não encontrar nenhuma fraude?

Compartilhe no: Facebook | Twitter | Google+


25 October 2014

Amanhã é dia de votar e fiscalizar. Em milhares de seções eleitorais, brasileiros e brasileiras atuarão como fiscais independentes, fiscalizando os Boletins de Urna e trabalhando por mais transparência no processo eleitoral.

Qualquer pessoa com um smartphone ou câmera digital pode ser fiscal. A seguir, elaboramos um passo-a-passo simples de como fiscalizar. #vemproBU você também!

Prepare-se

  1. Ir identificado(a) como fiscal independente pode facilitar na hora de conversar com os mesários e presidentes de seção. Caso tenha a camiseta do Você Fiscal, você pode usá-la, como fez o Wellington no 1º turno. Se não tiver a camiseta, você pode fazer um crachá como o do Guilherme (genial o vídeo!), utilizando a arte que disponibilizamos aqui.

  2. Imprima este PDF de uma página com os trechos da resolução 23.399 do TSE. Ela determina que o Boletim de Urna seja impresso e uma via seja afixada em local publicamente visível da seção. Leve a resolução impressa e mostre aos mesários e ao presidente da seção. Ela garante o seu direito de acesso ao BU.

  3. Divulgue o projeto para seus amigos e sua família e peça para alguém te acompanhar na fiscalização. Três vantagens: 1. é mais difícil dizer não para uma dupla ou grupo; 2. você terá ajuda para fotografar os BUs; 3. você terá testemunha(s) caso algo ocorra.

  4. Lembre-se também de carregar a bateria do celular e verificar o espaço livre na memória do seu aparelho. E programe-se para chegar na seção eleitoral às 16h30. A votação é encerrada às 17h e depois disso muitos lugares não deixam mais ninguém entrar. Chegue mais cedo e aproveite o tempo para passar pelas salas e conversar com os mesários sobre o projeto.

Mãos à obra: fiscalizando os BUs

O Boletim de Urna é como um recibo contendo o nome dos candidatos e o número de votos que cada um recebeu naquela urna. Ele não indica qual eleitor votou em que candidato, apenas o total de votos e por isso não fere o sigilo do voto.

O que não pode é tirar foto dentro da seção eleitoral, enquanto está ocorrendo a votação. O BU é impresso depois do encerramento da votação, e é público. Pode ficar tranquilo(a): não tem problema nenhum tirar foto! (E é bom levar o PDF acima impresso para garantir.)

O BU do 2º turno é bem menor que o do 1º turno, pois há menos candidatos. Ainda assim, é preciso tirar uma sequência de fotos, pois se você tirar uma foto só do BU inteiro o sistema não consegue reconhecer os dados que estão impressos nele.

É necessário tirar várias fotos ao longo de todo o comprimento do BU, do começo (onde diz “Justiça Eleitoral”) ao fim (onde tem as assinaturas dos mesários). Assim dá para confirmar que o fim de uma foto é o começo da próxima e que elas vieram de fato de um mesmo BU, identificado pela seção eleitoral no topo.

Com o aplicativo Você Fiscal para Android, tirar a sequência de fotos fica mais fácil. Para o 2º turno, fizemos algumas atualizações, melhorando especialmente o foco. Agora, o foco é ajustado tocando a tela do celular antes de cada nova foto, com o trecho do BU selecionado.

Se você quer contribuir com a fiscalização mas usa iPhone, Windows Phone ou não tem smartphone, este vídeo explica como fazer, utilizando a técnica da pinça com qualquer câmera.

Depois de tirar as fotos, envie pelo aplicativo ou para vocefiscal.org/upload. Pronto, em poucos minutos você contribuiu muito para melhorar a transparência eleitoral em nosso país.

Envie seu Boletim de Urna

Perguntas frequentes:

“Posso pedir uma via do BU para fotografar em casa?”

Os mesários podem imprimir até 15 vias do BU. Aproveite que você chegou cedo e converse com os responsáveis de cada seção, explique o projeto e o que você vai fazer com os boletins de urna e peça para que imprimam uma via adicional para você. Vai depender da boa vontade do mesário, mas muitos fiscais conseguiram no 1º turno. Vale a pena tentar.

“Posso fotografar só os dados da votação para presidente?””

Para que as suas fotos possam ser comparadas com os dados divulgados pelo TSE, precisamos das informações que constam no início do BU, como o código de identificação da una eletrônica e o número de correspondência. Assim, você precisa tirar fotos de todos os trechos do BU, para que possamos comprovar a origem dos dados e compará-los com a versão digital do TSE.

“Posso filmar o BU?”

Infelizmente, não, pois o software de extração dos dados para análise dos BUs trabalha a partir de fotos apenas. Saiba como é feita a análise das imagens dos BUs.

“Posso tirar fotos panorâmicas?”

Não recomendamos, pois o sistema de captura de fotos panorâmicas não é feito para preservar texto. Ou seja, as informações do BU podem não ficar reconhecíveis para a análise.

Se tiver qualquer outra dúvida, acesse a FAQ do Você Fiscal.

Estaremos juntos neste dia tão importante. Agradeçemos a sua participação e contamos com você para fazer um 2º ainda melhor.

Abraço,
Equipe Você Fiscal

Compartilhe no: Facebook | Twitter | Google+


22 October 2014

Têm circulado na Internet posts, no Twitter e no Facebook, do candidato Delegado Protógenes Queiroz, com denúncias de fraude eleitoral.

Levantar suspeitas sobre a possibilidade de fraudes eleitorais é um direito de todos os candidatos e também de todos os eleitores.

Porém, ao mencionar o Prof. Diego Aranha e o projeto Você Fiscal em seu tweet “O prof Diego da UNICAMP fala das fraudes das urnas eletrônicas nesse 2º turno. Tem um esquema rolando no RJ”, o Delegado deu a entender que o professor tivesse encontrado fraudes nas urnas eletrônicas que poderiam confirmar sua denúncia.

Isso é falso: nem o Prof. Diego Aranha nem o Projeto Você Fiscal jamais afirmaram ter encontrado alguma fraude. O que a equipe da UnB coordenada pelo professor revelou nos testes realizados pelo TSE foram falhas de segurança que abrem brechas para fraudes eleitorais. Tudo o que falamos até agora diz respeito a falta de transparência, falhas de segurança, defeitos de projeto e vulnerabilidades que comprometem a segurança do processo eleitoral.

Alertamos, para que as fraudes sejam prevenidas: jamais afirmamos (até o momento) tê-las encontrado. (E caso nenhuma seja encontrada, vale lembrar, isso não quer dizer muito.)

Orientação partidária

O Projeto Você Fiscal é uma iniciativa independente, acadêmica, apartidária e sem ligação com nenhuma empresa ou grupo. O mesmo vale para o posicionamento dos seus membros sobre quaisquer assuntos relacionados à votação eletrônica.

Qualquer insinuação do contrário é incorreta.

Candidatos, partidos, empresas e todos os cidadãos são bem-vindos a divulgar o Você Fiscal, participar da fiscalização coletiva conosco e levantar o debate sobre a falta de transparência eleitoral. Acreditamos que é um tema que toca à toda a sociedade, e deve ser discutido em todas as suas esferas.

Nosso compromisso, porém, é com a análise técnica e aperfeiçoamento do sistema de votação eletrônica usado no Brasil e com a adoção de um modelo de voto publicamente auditável.

O primeiro passo nessa direção é a fiscalização do Boletim de Urna, uma das poucas partes do processo eleitoral que é publicamente auditável. Não temos equipe para, e nunca nos comprometemos a investigar todas as denúncias de fraudes que são divulgadas. Não damos parecer ou opinião sobre denúncias que não estejam ligadas à análise dos dados de BUs enviados pelos fiscais de todo o Brasil.

Nossos esforços este ano serão dirigidos à conscientização sobre a necessidade de fiscalização cidadã e à auditoria coletiva dos Boletins de Urna.

Esclarecemos, portanto, que o Você Fiscal não confirma, nega, nem deve ser associado a denúncias de fraude exceto se algum posicionamento for publicado oficialmente pelo projeto neste blog (o que ainda não aconteceu).

Os dados dos BUs são abertos para pesquisa independente e consulta pública: https://github.com/vocefiscal/vocefiscal-backend. Não faremos análise relativa a denúncias específicas, mas se encontrarmos qualquer divergência, em qualquer cidade que seja, ela será publicada e divulgada. Paralelamente, todos estão livres para fazer suas próprias análises na base de dados e tirarem suas próprias conclusões (não queremos confiança cega nem no TSE, nem em nós mesmos).

E, acima de qualquer discussão partidária, convidamos todos a fiscalizarem conosco este 2º turno, dia 26 de outubro. Obrigado!

Cordialmente,
Equipe Você Fiscal

Compartilhe no: Facebook | Twitter | Google+


19 October 2014

O tratamento das imagens dos Boletins de Urna consiste em duas etapas:

  1. “costura” das fotos de um mesmo Boletim de Urna em uma foto única;

  2. extração da informação na imagem resultante através de reconhecimento de caracteres.

O objetivo da costura é aprimorar a usabilidade, para produzir uma imagem única de fácil comparação visual com o Boletim de Urna eletrônico publicado no site do TSE. A extração de informação é a etapa mais crítica, pois permite verificar se as quantidades de votos são compatíveis entre Boletim de Urna impresso e eletrônico. Para a primeira etapa, utlizamos o algoritmo de costura da biblioteca em código aberto OpenCV. Os resultados preliminares foram animadores e gerados rapidamente para Boletins de Urna compostos por poucas imagens, conforme imagem abaixo.

Entretanto, o desempenho cai assustadoramente para Boletins de Urna compostos por muitas fotos, pois o OpenCV tenta todas as combinações possíveis para encaixar as fotos. Após alguns ajustes, forçamos a implementação a tentar encaixar apenas as fotos em ordem, mas a ausência de textura na sobreposição dificulta o cálculo de similaridade entre fotos consecutivas. Descobrimos, portanto, que os algoritmos atuais de costura são mais orientados a textura e a sobreposição de texto simples entre duas fotos não parece suficiente. Continuamos trabalhando nessa direção!

Para a segunda etapa de reconhecimento de caracteres, estamos utilizando o motor de código aberto Tesseract, treinado especificamente para a fonte da urna eletrônica. Os arquivos de treinamento estão no repositório e enfatizam o reconhecimento de números. Em primeiro lugar, aplicamos binarização como pré-processamento, para destacar o texto do fundo.

Após o pré-processamento, o reconhecimento de caracteres é capaz de recuperar a maior parte da informação na imagem, especialmente quando o treinamento é realizado com imagens já binarizadas:

Justiça Eleitorall
Tribunal Regional Eleitoral [sp]
Boletim de Urna
Eleições Gerais 2014
iº Turno
(05/10/2014)
Município 63134
CARAPlCUlBA
Zona Eleitoral 0303
Local de Votação 1384
Seção Eleitoral 0379
Eleitores aptos 0340
Comparecimento 0274
Eleitores faltosos 0066
Código identificação UE 01564145
Data de abertura da UE 05/10/2014
Horário de abertura 08:00 00
Data de fechamento da UE 05/10/2014
Horário de fechamento 17:01:01
RESUMO DA CORRESPONDÊNClA
630:382
Código Verificador: 68950

Utilizamos esse procedimento para fazer uma triagem e organizar a base de imagens recebida pelo aplicativo. Para cada Boletim de Urna recebido, utilizamos reconhecimento de caracteres para recuperar o resumo da correspondência na primeira foto. Caso encontrado, é possível obter o número da zona e seção corretos a partir da base de correspondências efetivadas do TSE. Utilizamos um programa bem simples em Python para verificar se os dados preenchidos pelos usuários são compatíveis com as informações recuperadas a partir do resumo da correspondência. Em caso negativo ou se a correspondência não for encontrada, o programa apresenta a imagem e solicita tratamento manual. Por isso, o procedimento é semi-automático e toma bastante tempo para uma base grande.

Como resultado, fomos capazes de confirmar a origem de 7671 dos 11530 Boletins de Urna recebidos, que seguem agora para extração das demais informações. Inúmeros erros de preenchimento foram corrigidos, produzindo portanto três bases distintas, disponíveis no repositório:

  1. A primeira base (base-original.zip) contém os metadados brutos, apenas anonimizados.

  2. A segunda base (base-corrigida.zip) contém os metadados separados após triagem e correção de erros de preenchimento.

  3. A terceira base (base-organizada.zip) contém os metadados organizados por município/zona/seção eleitoral.

Os Boletins de Urna cuja origem não foi confirmada ainda não foram descartados, mas precisarão de outra estratégia de confirmação, possivelmente o código de carga impresso no final do documento. As estatísticas de submissão por estado podem ser encontradas abaixo, onde a última coluna exibe quantas submissões daquele estado tiveram origem confirmada:

U.F. Total Confirmados U.F. Total Confirmados
AC 8 8 PB 52 33
AL 45 41 PE 223 179
AM 51 19 PI 30 20
AP 11 10 PR 961 653
BA 231 154 RJ 733 522
CE 135 101 RN 77 54
DF 1023 751 RO 61 14
ES 304 245 RR 6 5
GO 429 282 RS 532 397
MA 69 44 SC 825 618
MG 1334 973 SE 38 23
MS 193 127 SP 3249 2102
MT 164 117 TO 66 30
PA 105 81 ZZ 71 68

Segundo turno

A análise dos dados do 1º turno continua, mas o 2º turno não pode esperar.

Aprendemos muito, e o segundo tem que ser ainda melhor, com mais BUs fiscalizados e a experiência acumulada na metodologia de análise. Participe:

Vamos levar a fiscalização cidadã a todos os cantos do país! É preciso fiscalizar sempre.

Compartilhe no: Facebook | Twitter | Google+



Artigos anteriores