-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathnombres.pl
82 lines (63 loc) · 2.16 KB
/
nombres.pl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
use utf8; #permite que se compilen caracteres especiales como las vocales tildadas y las eñes
open (datos,"<:encoding(UTF-8)","dataset.txt"); #hace que lea el txt tal y como esta escrito, incluidas los caracteres esperciales
@informacion=<datos>; #guarda cada linea dentro del arreglo "@informacion"
close (datos);
#todos los resultados se imprimirán aquí
open (sal,">salida.txt");
#guarda solo las lineas que tienen texto, se salta las lineas en blanco
foreach $inf(@informacion){
if (length($inf)>2) {
push(@parrafos,$inf);
buscaNombre($inf);
buscarEstudios($inf);
#buscaEdad($oracion);
#print sal "$oracion\n";
#print sal $oraciones[$var];
#buscarEstudios($oraciones[$var]);
print sal "\n\n";
undef(@oraciones);
}
}
close (sal);
sub buscaNombre {
$nom=$_[0];
if ($nom =~ /(nombre es |llamo )([A-Za-záéíóÁÉÍÓÚ\s]+)*/) {
$nombre=$2;
if($nombre=~/([A-Za-záéíóúÁÉÍÓÚS\s]+)*(tengo|nac[íi])/){
print sal "Nombre: ".$1."\n";
}else{
print sal "Nombre: ".$nombre."\n";
}
}
}
sub buscarEstudios {
$nom=$_[0];
if ($nom =~ /([eE]studi[oeé] |estudiante )([A-Za-záéíóÁÉÍÓÚS,.\s]+)*/) {
$estudios=$2;
#print sal $2."\n";
if($estudios=~/([Ii]ngenier[íi]a|Ing\.)([A-Za-záéíóÁÉÍÓÚS\s]+)*/){
$carrera=$2;
if($carrera=~/([A-Za-záéíóÁÉÍÓÚS\s]+)*(en ESPOL|en la Escuela|en la ESPOL)/){
print sal "Carrera: Ingeniería $1 \n"
}else{
print sal "Carrera: Ingeniería $carrera \n"
}
}elsif(/(carrera (es|de estudio|de))([A-Za-záéíóÁÉÍÓÚS\s]+)*/){
$carrera=$2;
if($carrera=~/([A-Za-záéíóÁÉÍÓÚS\s]+)*(en ESPOL|en la Escuela|en la ESPOL)/){
print sal "Carrera: Ingeniería $1 \n"
}else{
print sal "Carrera: $carrera \n"
}
}elsif($estudios=~/[Ll]eyes/){
print sal "Carrera: Leyes \n"
}
if($estudios=~/([Ee][Ss][Pp][Oo][Ll]|Escuela)/){
print sal "Universidad: ESPOL \n"
}elsif($estudios=~/([Cc][Aa][Tt][Oo][Ll][Ii][Cc][Aa]|[Uu][Cc][Ss][Gg])/){
print sal "Universidad: Católica \n"
}elsif($estudios=~/([Ee]statal|[Uu]niversidad de [Gg]uayaquil)/){
print sal "Universidad: Estatal \n"
}
}
}