-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathdiario_municipal.py
69 lines (54 loc) · 2.19 KB
/
diario_municipal.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
import json
import re
import unicodedata
from datetime import date
class Municipio:
def __init__(self, municipio):
municipio = municipio.rstrip().replace('\n', '') # limpeza inicial
# Alguns nomes de municípios possuem um /AL no final, exemplo: Viçosa no diário 2022-01-17, ato 8496EC0A. Para evitar erros como "vicosa-/al-secretaria-municipal...", a linha seguir remove isso.
municipio = re.sub("(\/AL.*|GABINETE DO PREFEITO.*|PODER.*|http.*|PORTARIA.*|Extrato.*|ATA DE.*|SECRETARIA.*|Secretaria.*|Fundo.*|SETOR.*|ERRATA.*|- AL.*|GABINETE.*|RATIFICAÇÃO.*)", "", municipio)
self.id = self._computa_id(municipio)
self.nome = municipio
def _computa_id(self, nome_municipio):
ret = nome_municipio.strip().lower().replace(" ", "-")
ret = unicodedata.normalize('NFKD', ret)
ret = ret.encode('ASCII', 'ignore').decode("utf-8")
return ret
def __hash__(self):
return hash(self.id)
def __eq__(self, other):
return self.id == other.id
def __str__(self):
return json.dumps(self.__dict__, indent=2, default=str, ensure_ascii=False)
class Diario:
_mapa_meses = {
"Janeiro": 1,
"Fevereiro": 2,
"Março": 3,
"Abril": 4,
"Maio": 5,
"Junho": 6,
"Julho": 7,
"Agosto": 8,
"Setembro": 9,
"Outubro": 10,
"Novembro": 11,
"Dezembro": 12,
}
def __init__(self, municipio: Municipio, cabecalho: str, texto: str):
self.municipio = municipio.nome
self.id = municipio.id
self.cabecalho = cabecalho
self.texto = texto.rstrip()
self.data_publicacao = self._extrai_data_publicacao(cabecalho)
def _extrai_data_publicacao(self, ama_header: str):
match = re.findall(
r".*(\d{2}) de (\w*) de (\d{4})", ama_header, re.MULTILINE)[0]
mes = Diario._mapa_meses[match[1]]
return date(year=int(match[2]), month=mes, day=int(match[0]))
def __hash__(self):
return hash(self.id)
def __eq__(self, other):
return self.id == other.id
def __str__(self):
return json.dumps(self.__dict__, indent=2, default=str, ensure_ascii=False)