Raspador de texto das Emendas Parlamentares do DF 2012 para o DeOlhoNasEmendas - TXT 2 CSV para Ushahidi:
Este scraperwiki foi escrito para gerar os dados a serem Georeferenciados na Plataforma ONE(de Olho Nas Emendas do DF). Os dados foram obtidos de PDFs de documentos escaneados e ilegíveis por máquina. Os textos processáveis foram obtidos através de processo OCR que gerou arquivos txt das referidas emendas. As entidades e valores das emendas foram extraídas pelo presente scraperwiki baseado em linguagem Python e pode ser rodado em: https://scraperwiki.com/scrapers/raspador_de_texto_das_emendas_parlamentares_do_df_/
O ONE - De Olho Nas Emendas - Georeferencia as Emendas dos Deputados Distritais à Lei Orçamentária Anual do DF. Com ele é possível ao cidadão verificar que obras ou serviços estarão sendo entregues em sua vizinhança durante o ano. Nele é possível filtrar as Emendas por Deputado, tipo de gasto, Evento ou Órgão que administrará o recurso e ver em quais Regiões do DF(Cidades ou Regionais) estão sendo aplicado estes recursos.
O ONE foi concebido pelo coletivo Transparência Hacker DF juntamente com o Adote um Distrital(Veja vídeo). A primeira iniciativa ocorreu em novembro de 2011 quando os dados das emendas foram obtidos dos protocolos das emendas escaneados e disponibilizados pela Camâmara Distrital em péssimos PDFs baixados a partir de: http://www.cl.df.gov.br Os Thackeos rasparam os dados atraves de: https://scraperwiki.com/scrapers/raspador_de_texto_das_emendas_parlamentares_do_df_/
Os sistemas ONE estão disponíveis em:
Emendas CLDF 2012: https://www.eufiscalizo.com.br
Emendas CLDF 2013: https://emendas.crowdmap.com