Skip to content

Latest commit

 

History

History
135 lines (100 loc) · 4.2 KB

README.md

File metadata and controls

135 lines (100 loc) · 4.2 KB

npm version Build Status Maintainability Test Coverage

Interpretador de Articulação

O interpretador de Articulação é uma biblioteca de parser de texto articulado extraído do editor de articulação, ambas elaboradas pela Assembleia Legislativa de Minas Gerais, como parte do Sistema de Informação Legislativa de Minas Gerais (Silegis-MG).

Ele permite a interpretação de texto articulado (texto puro), transformando em um objeto estruturado contendo dispositivos, tais como artigos, parágrafos, incisos, alíneas e itens, bem como as divisões em preâmbulo, títulos, capítulos, seções e subseções. O resultado da interpretação é uma árvore de objetos estruturado, contendo a articulação completa.

Como usar em seu código

npm install --save-prod silegismg-interpretador-articulacao

API do interpretador

Para interpretar um texto puro, transformando em um objeto estruturado, utilize a função interpretar (veja código-fonte), com a seguinte sintaxe:

// nodejs
const interpretador = require('silegismg-interpretador-articulacao');

let resultado = interpretador.interpretarArticulacao(texto);
// typescript
import { interpretarArticulacao } from 'silegismg-interpretador-articulacao';

let resultado = interpretarArticulacao(texto);

onde texto é uma string.

O resultado é um objeto contendo a seguinte interface:

/**
 * Resultado da interpretação de articulação.
 */
interface IArticulacaoInterpretada {
    /**
     * Texto que antecede primeiro dispositivo interpretado.
     * Se a interpretação compreendeu todo o texto,
     * este atributo deve vir vazio.
     */
    textoAnterior: string;

    /**
     * Articulação interpretada.
     */
    articulacao: QualquerDispositivo[];
}

type QualquerDispositivo = Artigo | Paragrafo | Inciso | Alinea | Item | Titulo | Capitulo | Secao | Subsecao

abstract class Dispositivo {
    public tipo: string;
    public numero?: string; // Pois pode ser "123-A"
    public descricao: string;
}

class Artigo extends Dispositivo {
    incisos: Inciso[];
    paragrafos: Paragrafo[]
}

class Inciso extends Dispositivo {
    alineas: Alinea[]
}

class Alinea extends Dispositivo {
    itens: Item[]
}

class Paragrafo extends Dispositivo {
    incisos: Inciso[]
}

abstract class Divisao extends Dispositivo {
    subitens: Dispositivo
}

class Titulo extends Divisao { }
class Capitulo extends Divisao { }
class Secao extends Divisao { }
class Subsecao extends Divisao { }

Opções de interpretação

O método interpretarArticulacao(texto: string, opcoes: IOpcoesInterpretacao) permite estender a capacidade do parser, seja por meio da introdução de parsers extras de linha ou de escapes extra de texto.

interface IOpcoesInterpretacao {
    parsersExtras?: ParserLinha[];
    escapesExtras?: EscapeInterpretacao[];
}

Nesta biblioteca existe apenas a implementação do escape de tags de HTML, por meio da classe EscapeTags.

API do validador

Após a interpretação, é possível validar o conteúdo estruturado por meio do método validarArticulacao.

import { interpretarArticulacao } from 'silegismg-interpretador-articulacao';

const resultado = interpretarArticulacao(texto);
const validacao = validarArticulacao(resultado.articulacao);

if (validacao.length > 0) {
    throw new Error('Há erros do conteúdo interpretado.');
}

Os seguintes critérios são avaliados durante a validação:

  • formatação do dispositivo, verificando se o padrão adequado é adotado naquele dispositivo;
  • sequência numérica;
  • conteúdo e pontuação.