Relatório Técnico sobre o repentino



Baixar 418,56 Kb.
Página2/3
Encontro03.05.2017
Tamanho418,56 Kb.
1   2   3

A recolha dos exemplos


A recolha de exemplos não foi feita de uma forma arbitrária, mas sim orientada pelas necessidades de desenvolvimento do SIEMÊS. De facto, o funcionamento do SIEMÊS passa precisamente pela tentativa de detectar semelhanças entre entidades que encontra em texto livre e outras que façam parte da sua base de conhecimento. Sem entrar em grande detalhes acerca do SIEMÊS neste documento, poderemos dizer que o SIEMÊS aumenta a sua capacidade de detectar e classificar correctamente uma dada entidade mencionada quando possui na sua base de conhecimento um exemplo de uma entidade nomeada próxima lexicalmente falando (possivelmente até igual). Com essa informação e com informação sobre contexto analisada posteriormente (daí a estratégia siamesa), o SIEMÊS formula um juízo de classificação.

Com o desenvolvimento de versões minimamente funcionais do SIEMÊS foi possível realizar os primeiros testes, inicialmente usando o material fornecido pela organização do HAREM e, mais tarde, usando texto retirado aleatoriamente do WPT03 e do CETEMPúblico. Por uma questão de simplicidade, o REPENTINO foi usado pelo SIEMÊS desde o início como base de conhecimento, apesar de isso não ser obrigatório e ser até prejudicial do ponto de vista da performance computacional. Houve desde o início do desenvolvimento planos para compilar uma base de conhecimento optimizada para o SIEMÊS a partir da informação do REPENTINO, mas isso acabou por não ser realizado.

No entanto, e a partir dos testes realizados ao sistema SIEMÊS+REPENTINO foi possível guiar todo o processo de recolha de exemplos. Sempre que o SIEMÊS não era capaz de classificar correctamente uma entidade mencionada por falta de evidências que deveriam supostamente estar na sua base de conhecimento, eram efectuadas recolhas de exemplos de entidades que depois eram acrescentadas ao REPENTINO para colmatar a falha do SIEMÊS. Normalmente, a detecção de uma falha de “conhecimento” do SIEMÊS levava à adição de várias dezenas de exemplos ao REPENTINO. Por exemplo, supondo que o SIEMÊS não foi capaz de classificar “Faculdade de Letras da Universidade do Porto”, por falta de dados na sua base de conhecimento (para o efeito, o REPENTINO) então seriam pesquisados e adicionados ao REPENTINO vários exemplos de Faculdades (ex: “Faculdade de Medicina da Universidade de Coimbra”) e eventualmente de outras entidades que fossem próximas semanticamente (ex: “Escola Superior de Educação do Instituto Politécnico do Porto”. Esta política de aquisição de exemplos permitiu guiar o processo de recolha mais focadamente.

A recolha propriamente dita dos exemplos de entidades nomeadas foi realizada empregando dois métodos distintos. Por um lado, e aproveitando o facto de termos disponível localmente corpora de grandes dimensões, como o CETEMPúblico, e colecções de texto massivas, como o WPT03, foram efectuadas pesquisas sobre texto livre usando padrões lexicais. Por outro lado, foram procurados em sítios Web temáticos listas de exemplos de entidades nomeadas, sendo os sítios Web encontrados quer usando os motores de pesquisa habituais, quer a partir do conhecimento dos membros da equipa do Pólo. Estas duas aproximações eram de certa forma complementares relativamente à capacidade que tinham de encontrar novos exemplos. Note-se que em ambos os casos foi sempre necessário algum esforço manual no tratamento, validação e organização dos candidatos a exemplo recolhidos.


Pesquisa de exemplos usando Padrões e Corpora


Relativamente ao primeiro método, a extracção de exemplos a partir de texto livre essa foi realizada maioritariamente sobre o WPT03. Para que o processo de extracção pudesse ser realizado com alguma eficiência e acima de tudo sem demasiado trabalho manual de tratamento e validação, decidimos executar pesquisas focadas numa determinada subcategoria. Assim, tentámos explorar três propriedades que se verificam para certas categorias de entidades e que facilitam a sua detecção em texto livre:


  1. a presença de uma “cabeça” descriminatória. Grande parte das entidades, normalmente organizações, possuem uma estrutura relativamente bem definida, começando por um conjunto de palavras que permite a identificação da subcategoria de uma forma simples. Por exemplo: “Universidade do Porto”, ou “Junta de Freguesia de Ramalde”.

  2. uma forte probabilidade de ocorrência num determinado contexto “típico”. Há certos contextos relativamente bem conhecidos e fáceis de formular que permitem a extracção de certas entidades. Por exemplo, se estivermos a pesquisar locais a instanciação de um padrão como “localizado na XXX” ou “próximo da XXX” indicia fortemente que “XXX” se tratará de um local.

  3. a presença de um sufixo descriminatório. Certas entidades, normalmente organizações, possuem como sufixo partículas típicas como “Lda.” ou “S.A”.

Poderia afirmar-se que o conhecimento destes padrões esvazia a necessidade da construção do próprio REPENTINO com o objectivo de auxiliar sistemas de REM: se sabendo os padrões se consegue recolher e classificar entidades, então porquê armazenar os exemplos, ainda por cima excluindo os contextos. Na verdade isto não é bem assim, porque o problema é um pouco mais complexo.

Em primeiro lugar, o facto de existirem certos contextos típicos ou regularidades morfológicas (cabeças ou sufixo) que indiciam a classe de uma determinada entidade, isto não permite só por si resolver o problema do REM. De facto, os contextos típicos ocorrem com uma frequência muito reduzida, ou sofrem grandes variações em torno de uma versão base, pelo que só em certas ocasiões em que a forma do discurso é controlada, ou em situações onde existe muita redundância, é que se torna possível fazer uso efectivo de tais padrões. Além disso, as entidades nomeadas admitem normalmente muitas variações (supressões de prefixos, transformação parcial em acrónimos, e.g.: “C.M. Lisboa”) e que dificultam bastante a sua detecção e classificação. Ou seja, a utilização exclusiva de padrões e de regras baseadas em certas regularidades morfológicas, mesmo que não ambíguas, nem sempre é exequível do ponto de vista prático pela incapacidade de lidar com todas as variações válidas e possíveis.

Em segundo lugar, a utilização de padrões permite, e apenas em certas circunstâncias como referido anteriormente, eventualmente diferenciar semanticamente as entidades até um certo nível de detalhe. Ou seja, um determinado padrão poderá indiciar que uma entidade se trata de uma Organização, mas só em casos muito particulares é que será possível discriminar entre uma empresa ou uma associação recreativa. Ainda a este nível, as regularidades morfológicas permitem algo mais a este nível, mas há tantos casos que a codificação das regras necessita de uma base de exemplos vasta, pois a sua codificação manual a partir da intuição pessoal de quem as constrói é inviável. A combinação das duas informações parece ainda mais complexa de codificar.

E esta condição leva a um argumento final relativamente à construção do REPENTINO. Um recurso depois de construído pode ter múltiplos usos e ser usado para desenvolver sistemas sem ter de partir do vazio. Por exemplo, parece-nos bastante viável a construção de uma boa base de padrões lexicais altamente descriminatórios a partir da compilação dos contextos encontrados quando se pesquisa em corpora cada uma das entidades do REPENTINO já previamente classificadas. Ou a construção automática de regras baseadas em regularidades morfológicas que permitam a análise expedita das possíveis categorias de uma dada entidade.

O processo de recolha pode então ser decidido em 6 etapas:




  1. escolher uma categoria para a qual se pretende pesquisar exemplos de entidades

  2. decidir qual a estratégia mais apropriada para a pesquisa de exemplos: pesquisa por “cabeça”, por contexto ou por sufixo);

  3. construir o respectivo padrão e executar a pesquisa usando scripts em Perl desenvolvidos para o efeito. As pesquisas eram efectuadas sobre o WPT03.

  4. validação manual dos candidatos obtidos tendo em conta a categoria pretendida. Contudo, alguns resultados inválidos obtidos poderiam ser apropriados para outras categorias, pelo que muitas vezes sugeriam certos padrões de pesquisa interessantes para as referidas categorias.

  5. introdução dos candidates positivos na base de dados

  6. se necessário, era criada uma nova categoria/subcategoria que aumentava assim o sistema de classificação

A próxima figura resume o processo descrito:



Figura 2 - O processo de recolha de exemplos usando pesquisa de padrões sobre corpora


Cada ronda completa sobre a totalidade do WPT03 demorava inicialmente entre 2h30 e 3h00, já incluindo a revisão manual dos exemplos recolhidos. Normalmente, por cada ronda é possível encontrar cerca de 500 a 1000 exemplos. O processo de pesquisa sobre o WPT03 foi entretanto optimizado, sendo agora possível pesquisar a totalidade do WPT03 em menos de 15 minutos. Contudo o tempo de revisão manual dos exemplos recolhidos eleva o tempo total de cada ronda para cerca de 1h.

Durante o processo de extracção usando padrões foram muitas vezes encontrados contextos em torno de certos exemplos positivos que considerámos importante armazenar. Estes contextos têm quase sempre uma função de modificação dos exemplos recolhidos que podem ser utilizados em futuras análises ou com o objectivo de criar regras de classificação. Por exemplo, se encontrássemos “margem do Rio Douro” adicionaríamos ao REPENTINO tanto a entidade base “Rio Douro” como uma versão do exemplo com o modificador “margem do Rio Douro”. Não conseguimos ainda avaliar o impacto desta decisão na qualidade geral do recurso, mas podemos dizer que estes casos são relativamente raros relativamente à totalidade de exemplos armazenados. Em todo o caso, o sistema de administração do REPENTINO permite uma rápida alteração ou eliminação destes casos, se isso se tornar necessário.

Pesquisa de exemplos na Web


Relativamente ao segundo método, pouco há a dizer tirando o facto se ter recolhido informação de mais de 120 sítios Web. Este método é mais apropriado para obter exemplos de entidades cuja pesquisa em corpora é muito mais difícil, quer pela variedade de contextos em que podem ocorrer, quer pelas variadíssimas formas que podem assumir. Por exemplo, nomes de músicas, software, filmes e outros produtos culturais possuem estas características: por um lado é difícil especificar a sua forma e os eventuais contextos, por outro são facilmente localizáveis em sítios Web temáticos que apresentam longas listas de exemplos.

Em termos de variedade de entidades recolhidas um dos principais destaques vai para o sítio Web da Wikipedia onde foi possível encontrar exemplos para diversas entidades. O sítio de onde foi possível recolher mais exemplos foi o do Tribunal Superior Eleitoral do Brasil, (http://www.tse.gov.br) de onde pudemos recolher mais de 257 mil nomes de candidatos das listas eleitorais dos vários estados do Brasil. Para mais detalhes acerca das fontes usadas remete-se o leitor para a página de estatísticas do sítio oficial do REPENTINO.


O sistema de classificação do REPENTINO


Como referido anteriormente, o sistema de classificação do REPENTINO foi crescendo e foi sendo adaptado à medida que eram encontrados exemplos de novas entidades, o que por sua vez era motivado pela detecção de falhas de cobertura no SIEMÊS. Por esse motivo o sistema de classificação do REPENTINO apresenta importantes diferenças relativamente à hierarquia de classificação semântica proposta pela organização do HAREM, apesar de ter sido fortemente inspirada nessa proposta. O sistema de classificação actual do REPENTINO inclui 11 categorias de topo e 102 subcategorias, um valor bastante diferente das XX subcategorias previstas no HAREM distribuídas também por 11 categorias de topo, embora distintas. As categorias de topo do sistema de classificação do REPENTINO são:


  1. Abstracções

  2. Arte / Media / Comunicação

  3. Natureza

  4. Eventos

  5. Papeladas

  6. Locais

  7. Organizações

  8. Produtos

  9. Seres

  10. Substâncias

  11. Outros

O mapeamento das categorias do REPENTINO para o HAREM é normalmente de N para 1, embora haja alguns casos de subcategorias previstas no REPENTINO que não foram previstas no HAREM, e outras cujo mapeamento não é consensual havendo sobreposição com mais do que uma subcategoria alvo. Estas diferenças foram depois notórias durante a transferência dos resultados do SIEMÊS do seu sistema de classificação directamente derivado do REPENTINO para o sistema de classificação da avaliação conjunta.



Em seguida iremos descrever em detalhe cada uma das categorias e as respectivas subcategorias fornecendo exemplos ilustrativos em cada um dos casos. Convém desde já referir que apesar dos esforços desenvolvidos o sistema de classificação não é totalmente ortogonal, havendo em alguns casos situações de sobreposição entre duas ou mais subcategorias. Em todo o caso, espera-se com o evoluir do sistema resolver alguns destes problemas de ambiguidades, sabendo à partida que qualquer solução será sempre uma solução de compromisso.

Abstracções


Esta categoria inclui entidades abstractas tais como disciplinas, ciências, teorias e outras formulações mentais. Períodos, movimentos, estados, doenças e índices também fazem parte desta categoria. As ‘Abstracções’ podem ser divididas nas seguintes subcategorias:


  1. Estado/Condição - doenças e outros estados/condições permanentes ou temporários. Ex: 'doença de Alzheimer', 'SIDA', 'síndrome de Down'.

  2. Crime - todo o tipo de crimes previstos na lei. Ex: 'peculato', 'tráfico de influências', 'homicídio simples', 'lenocínio', etc.

  3. Disciplina/Arte & Ofício - onde se incluiriam, por exemplo, 'Inteligência Artificial', 'Belas-Artes', 'Ciências da Educação', 'Electrónica', 'Tapeçaria Oriental', 'Tai-chi', 'Futebol', etc.

  4. Período/Movimento/Tendência - movimentos, tendências ou outros períodos que tenham ocorrido num dado período da História. Ex: 'Renascimento', 'Movimento Feminista', 'Iluminismo', 'Budismo', 'Art Déco', etc.

  5. Formulação Mental - regras, teorias, formulações teóricas ou sistematizações. Ex: 'Lei de Murphy', 'Teoria da Relatividade', 'lei da gravitação de Newton', 'princípio da incerteza de Heisenberg', 'princípio da dualidade de De Broglie', etc.

  6. Era/Época - períodos de tempo em que se divide a história do Mundo. Ex: 'Idade da Pedra’, 'Era Mesozóica', 'Antiguidade Clássica', 'Jurássico', etc.

  7. Processo - Ex: 'fotossíntese', 'pseudomorfose', 'sulfatação', 'diferenciação magmática', 'processo anaeróbio aláctico', 'osmose', etc. 

  8. Símbolo - todo o tipo de símbolos religiosos, políticos, esotéricos, heráldicos, etc. Ex: 'Estrela de David','Crucifixo', 'Pentagrama', 'Selo de Salomão', etc.

  9. Índice/Taxa - índices, taxas e outros indicadores económicos. Ex: 'NASDAQ', 'PSI 20', 'Índice de Concentração Empresarial', 'taxa de inflação', 'taxa de abstenção', 'PIB', etc.

  10. Expressões Latinas – expressões em Latim que ocorrem com alguma frequência e que podem aparecer maiusculadas. Ex: ‘Ad hoc’, ‘Totus Tuum’, ‘Tabula rasa’, ‘Data venia’, etc.

  11. Tipo/Classe - conceito que representa um tipo ou classe de algo que não se encaixa em nenhuma das outras categorias ou subcategorias. Ex: 'Metro', 'Metropolitano', etc.

Arte / Media / Comunicação


Nesta categoria incluem-se apenas entidades nomeadas que são produtos relacionados com arte, media e comunicação. Estes podem ser divididos nas seguintes subcategorias:


  1. Filme - títulos de filmes. Ex: 'Indiana Jones em Busca do Templo Perdido', 'A Guerra das Estrelas', 'Dogville', etc.

  2. Livro - todos os livros ou publicações não periódicas, que possam ser consideradas equivalentes a livros, incluindo exemplares únicos. Ex: 'Os Maias', 'Sonho de Uma Noite de Verão', 'As Minhas Receitas de Bacalhau', etc.

  3. Música - títulos de músicas de todos os tipos, assim como peças musicais. Ex: 'Dunas', 'Jingle Bells', 'Bolero de Ravel', etc.

  4. Multimédia - jogos de computador e outros produtos multimédia, tais como cd-roms ou sítios web. Ex: 'Final Fantasy IV', 'Flight Simulator', 'Tomb Raider II', etc.

  5. Periódico - todo o tipo de publicações periódicas, normalmente impressas, tais como jornais e revistas. Ex: 'Expresso', 'Jornal de Notícias', 'Super Interessante', 'Exame', etc.

  6. TV/Radio/Teatro - programas e canais de rádio e televisão, assim como peças de teatro. Ex: 'Jornal da Noite', 'Acontece', 'Oceano Pacífico', 'My Fair Lady', 'Cats', 'SIC Comédia', 'AXN', 'RFM', 'The Green Lounge', 'Club 977 The '80s Channel', etc.

  7. Arte & Design - aqui incluem-se quadros, esculturas ou qualquer outro objecto de arte, único ou não. Ex: 'O Grito' de Munch, 'La Pietà', 'chaise longue de Le Corbusier', etc.

  8. Texto Académico/Científico - incluem-se aqui títulos de teses, artigos, dissertações e outros textos académicos e/ou científicos. Ex: 'Influência da granulometria na cinética de dissolução de fármacos', 'Hidrólise biocatalítica da trioleina', ' Tese de Mestrado em Literatura Portuguesa', 'A Statistical Approach to Machine Translation', 'A Maximum Entropy Approach to Natural Language Processing', etc.

Natureza


Nesta categoria incluem-se animais, vegetais, todos os elementos que constituem os organismos vivos, assim como os fenómenos naturais. Estes podem ser divididos nas seguintes subcategorias:


  1. Animal - todos os animais e respectivas espécies/raças. Ex: 'São Bernardo', 'Tubarão Martelo', 'Lince da Malcata', 'Tyranossaurus Rex', 'gato do Maine', etc.

  2. Fisiologia - todos os elementos que constituem os organismos vivos, como músculos, células, ossos, etc. Ex: 'Esternocleidomastoideu', 'aparelho de Golgi', 'células de Scwann', 'ADN', 'Perónio', 'Neurónio', etc.

  3. Micro-organismos - micróbios, bactérias, parasitas, fungos, protozoários, etc. Ex. 'bactéria Staphylococcus aureus', 'vírus Ébola', 'fungo da ferrugem asiática', 'Giardia Lamblia', 'protozoário Plasmodium vivax', etc.

  4. Vegetal - todos os vegetais e respectivas espécies. Ex: 'Alecrim', 'Pinus Pinaster', 'sabugueiro', 'couve de Bruxelas', 'pêra Rocha', 'camomila', 'salsa', etc.

  5. Fenómenos Naturais - aqui incluem-se os ventos, marés, terramotos, maremotos, ciclones, tufões, furacões, tempestades, etc. Ex: 'El Niño', 'Terramoto de 1755', 'ciclone Nancy', 'Zéfiro', 'furacão Ivan', 'Tempestade de Inverno Vivian', 'tufão Andrew', etc.

Eventos


Nesta categoria inclui-se todo e qualquer evento, cujo início ou duração estejam claramente definidos. Os eventos podem ser divididos nas seguintes subcategorias:


  1. Desportivo - acontecimentos desportivos, tais como campeonatos, torneios, entre outros. Ex: 'Jogos Olímpicos', 'Campeonato Nacional de Futebol', 'Torneio de Hóquei em Patins da Mealhada',  'Open do Estoril', etc.

  2. Socio-Cultural - reuniões ou ajuntamentos que envolvam qualquer actividade social ou cultural. Ex: 'Feira da Pêra Rocha', 'Feira da Senhora das Dores', 'Exposição Internacional Filatélica de Buenos Aires', 'Arraial D'Ajuda', 'Festival Internacional de Cinema', 'Festa de São Tomás de Aquino', 'Mostra de Artes Plásticas do Concelho de Loulé', etc.

  3. Efeméride - acontecimento ou período que tem lugar num determinado ponto da História. Ex: 'Dia D', 'I Grande Guerra Mundial', 'Guerra Civil Americana', 'Batalha de Aljubarrota', etc.

  4. Científico - acontecimentos científicos, tais como conferências, simpósios, etc. Ex: 'Congresso de Pneumologia e Tisiologia do Estado do Rio de Janeiro', 'Conferência Engenharia 2001', 'Colóquio Vitivinícola da Estremadura', 'Simpósio Internacional de Vulcanoespeleologia', etc.

  5. Cíclico - acontecimentos cíclicos que normalmente celebram/comemoram ou estão relacionados com uma determinada efeméride. Ex. 'Natal', 'Páscoa', 'Véspera de Ano Novo', 'Dia da Independência', 'Solstício', etc.

  6. Político - acontecimentos de carácter político, tais como cimeiras, congressos partidários ou comícios. Ex: 'Cimeira Mundial sobre Desenvolvimento Sustentável', 'Comício do Partido Comunista', 'Congresso do Partido Social Democrata', etc.

  7. Prémio/Galardão - Ex: 'Prémio Nobel da Literatura', 'Prémio Valmor', 'Galardão PME Excelência', 'Grande Prémio da Literatura Policial de França', etc.

Papeladas


Aqui incluem-se as leis, decretos, tratados, pactos, normas e planos. As entidades nomeadas que cabem nesta categoria podem ser divididas nas seguintes subcategorias:


  1. Lei - leis e decretos, em vigor ou não, promulgados por uma dada organização (ex: um país ou uma empresa) e que regulam o comportamento dentro dessa organização. Ex: 'Prohibition Act', 'Artº 14º do Decreto Lei  nº 43/46 de 20/01', 'Decreto Lei nº 445/91 de 20 de Novembro','Lei da Água', etc.

  2. Acordo - tratados, pactos e outras formas de acordos entre duas ou mais partes. Ex: 'Tratado de Tordesilhas', 'Pacto de Varsóvia', 'Convénio de Genebra', 'Declaração de Bolonha', 'Liga de Augsburgo', etc.

  3. Norma - normas acordadas oficialmente e que são estabelecidas com um objectivo funcional. Ex: 'Unicode Standard', 'ASCII', 'BETAMAX', 'ISO', etc.

  4. Certificações - alvarás, certidões, certificados, licenciaturas, formações, pós-graduações, apólices, licenças, mestrados, doutoramentos, etc. Ex: 'Alvará de Construção', 'Apólice de Seguro Automóvel', 'Certidão de Nascimento', 'Certidão Predial', ''Certificado de Aptidão Profissional', 'Curso de Árbitros', 'Licença de condução de ciclomotor', 'Licenciatura em Filosofia', 'Mestrado em Contabilidade', 'Pós-graduação em Direito Fiscal', etc.

  5. Impostos/Emolumentos - impostos ou outro tipo de emolumentos, como propinas, juros, etc. 'Imposto da SISA', 'Contribuição Autárquica', 'Propina Máxima', 'Taxa Moderadora', 'juros de Mora', etc.

  6. Planos e Procedimentos - todos os documentos que estabelecem um determinado plano de acção ou que determinam os procedimentos para a realização de um dado projecto/objectivo. Ex: 'Quinto Programa Quadro', 'Programa Sócrates/ERASMUS', 'Política de Privacidade', 'Plano Marshall', 'Orçamento do Estado para 2003', 'Plano Hidrológico Espanhol', etc.

  7. Documentos - todo o tipo de documentos burocráticos, tais como termos, minutas, relatórios, editais, actas, autos, balanços, ofícios, etc. Ex: 'Auto de denúncia', 'Balancete da Despesa', 'Bilhete de Identidade', 'Carta Circular nº 03/2001', 'Declaração Amigável de Acidente Automóvel', 'Ofício-Circular n.º2/2005', etc.

Locais


Esta categoria inclui todas as entidades nomeadas que são individualizadas sobretudo de acordo com a sua posição no universo. Os 'Locais' podem ser divididos nas seguintes subcategorias:


  1. Terrestre - regiões geográficas da Terra não tendo em atenção critérios políticos/administrativos. Inclui regiões com dimensões variáveis. Ex: Europa, Península Ibérica, vale do Rio Douro, etc.

  2. Hidro - locais geográficos constituídos fundamentalmente por água (ex: rios, lagos, oceanos, etc.). Ex: 'rio Guadiana', 'Lago Maggiore', 'Oceano Índico', etc.

  3. Espacial - pontos ou áreas localizadas no espaço, como, por exemplo, planetas, galáxias ou constelações. Ex: 'Mercúrio', 'Via Láctea', 'Ursa Maior', 'Constelação de Capricórnio', etc.

  4. Endereço - endereço explícito de um determinado local. Deverá conter informação suficiente para, pelo menos, identificar um edifício. Ex: 'rua Cândido dos Reis nº7 r/c 1495 - 030 - Algés', 'praça Almeida Garrett nº27', etc.

  5. Socio-cultural - edifícios ou áreas onde se realizam eventos socio-culturais, como teatros, estádios, galerias, museus, etc. Ex: 'Teatro Nacional D. Maria', 'Museu Soares dos Reis', 'Estádio do Dragão'.

  6. Religioso - edifícios ou áreas onde se realizam eventos religiosos, como igrejas, catedrais, mosteiros, mesquitas, sinagogas, etc. Ex: 'Sé de Braga', 'Igreja da Lapa', etc.

  7. Endereço Alargado - parecido com 'Endereço', mas não requer uma informação tão detalhada. Exemplos de endereços alargados são ruas, zonas como a 'Baixa' ou a 'Ribeira', praças ou outros locais dentro de uma área urbana. Ex: 'Rua de Cedofeita', 'Praça do Marquês', etc.

  8. País/Estado - países e uniões ou federações de países de acordo com fronteiras geopolíticas, assim como estados com alguma independência administrativa. Ex: Portugal, Emirados Árabes Unidos, Estados Unidos da América, Massachussets, Alabama, Maranhão, etc.

  9. Povoação/Região/Div. Administrativa - cidades, vilas, aldeias, freguesias, regiões, povoações, etc. Ex: Porto, Trás-os-Montes e Alto Douro, freguesia de Mafamude, A-dos-Cunhados, Vila da Marmeleira, Albufeira, etc.

  10. Civil/Administração/Militar - edifícios, complexos ou áreas relacionadas com organizações civis, militares ou administrativas, tais como quartéis, centros de saúde, bases militares, etc. Ex: 'Quartel dos Bombeiros Voluntários de Valadares', 'Base militar de Tancos', 'Centro de Saúde de Vilar do Paraíso', 'Aeródromo de Tires', 'Hospital de São João', etc.

  11. Património/Monumento - edifícios e outras construções consideradas património ou que são importantes por alguma razão simbólica. Ex: 'Torre Eiffel', 'Pirâmides Teotihuacán', 'Monumento aos Descobrimentos', 'Capela Sistina', etc.

  12. Propriedade - quintas, herdades ou outras propriedades que têm um nome próprio e cuja posse não é facilmente divisível. Ex: 'Quinta das Rosas', 'Herdade da Baracha', 'Solar dos Albuquerques', 'Casa do Sal', etc.

  13. Mitológico/Ficcional - locais que não existem de facto, mas que são referidos na literatura, cinema , etc. Ex: 'Atlântida', 'Isengard', etc.

  14. Comercial/Industrial/Financeiro - locais como parques industriais, minas, centros comerciais ou outros edifícios ou áreas que se destaquem essencialmente pela existência associada de actividades comerciais, industriais e/ou financeiras. Ex: 'Centro Comercial Vasco da Gama', 'Parque Industrial de São Domingos', 'zona industrial da Maia', 'Taguspark', 'loja FNAC em Matosinhos', 'Hotel Mercure Batalha', etc.

  15. Infraestrutura - todo o tipo de construções cuja finalidade seja essencialmente práctica, embora não possa ser definida claramente sob um ponto de vista comercial/industrial e financeiro. Incluem-se nesta categoria todas as infraestruturas de uso generalizado (estradas, pontes, barragens, etc.), bem como outras construções, cuja utilização seja múltipla ou indefinida, como é o caso de edifícios ou empreendimentos com nome próprio. Ex: 'Ponte da Arrábida', 'Edifício Les Palaces', 'A1', 'nó de Francos', 'barragem do Alqueva', etc.


1   2   3


©livred.info 2017
enviar mensagem

    Página principal