Opções tomadas relativamente à anotação da colecção dourada do Segundo HAREM, pista TEMPO

HAREM, Linguateca
Cristina Mota e Paula Carvalho
Versão 1.0

TEMPO clássico

Extensão da entidade quando incluída numa expressão que toda ela responde adequadamente a "(prep) quando?" ou "quando?"

Quando o núcleo da expressão é modificado por adjectivo, relativa ou sintagma preposicional, respondendo portanto toda a expressão adequadamente às interrogações "(prep) quando?" ou "quando?", apenas incluímos na entidade o modificador adjectival.

Exemplos:
 <EM>após a era</EM> de Armstrong
 <EM>nos tempos</EM> em que São Paulo amanhecia mais surpreendente
 <EM>do período Manuelino</EM>
 <EM>No ano</EM> que agora termina
 <EM>nos três dias</EM> de evento

Extensão da entidade quando a expressão é constituída por DATA e HORA

Quando uma expressão é composta por dois constituintes, um com valor de data e outro de hora, mesmo que um deles não se combine isoladamente com o predicado que modifica, violando um dos critérios para segmentação de uma sequência em duas, optámos por marcar isoladamente cada um deles.

Exemplos:
  nasceu <EM ID="hub-71248-191" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="HORA">aos 30 segundos</EM>
         <EM ID="hub-71248-192" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de hoje</EM>

  <EM ID="aa58069-369" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="HORA">Às 17h20</EM>
  <EM ID="aa58069-370" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de ontem</EM> em Lisboa

Classificação como GENERICO

Nos casos em que nos pareceu duvidosa ou mal-formada a formulação de todas as interrogações do critério 1, marcámos a entidade como GENERICO.

Exemplos:
  situado <EM ID="H2-dhy6432-141" CATEG="TEMPO" TIPO="GENERICO">nos dias de hoje</EM> no Paquistão 
  [*quando é que estava [Mehrgarh] situada no Paquistão? / nos dias de hoje]

  É ainda extremamente popular <EM ID="H2-dhy6432-142" CATEG="TEMPO" TIPO="GENERICO">hoje</EM>
  [*quando é que o [lápis-lazúli] é ainda extremamente popular? / hoje]
Apesar de termos achado pouco natural a formulação das interrograções com "(prep) quando?" ou "quando?" nos casos em que a entidade modifica um outro sintagma nominal sem valor temporal, considerámos que era mesmo assim mais aceitável que no caso anterior e como tal, não classificámos as entidades nessas situações como GENERICO.

Exemplos:
  os modernistas <EM ID="gtqqq-168" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">da década de 1920</EM>
  [*?os modernistas de quando? / da década de 1920]  

  os concretistas <EM ID="gtqqq-169" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">nos anos 1950</EM>
  [*?os concretistas quando? / nos anos 1950] 

Classificação como DURACAO

Expressões que não incluam unidades de medida temporal mas que tenham valor durativo, respondendo adequadamente à interrogação "(prep) quanto tempo?" foram marcadas com tipo DURACAO desde que verificassem um dos critérios 2.

Exemplos:
  Detroit tem <EM ID="2ght33-10" CATEG="TEMPO" TIPO="DURACAO">por longo tempo</EM>
  <EM ID="aa87333-155" CATEG="TEMPO" TIPO="DURACAO">durante um período</EM> de férias

Classificação de expressões iniciadas por "há"

No caso de expressões temporais iniciadas por "há", que muitas vezes parecem traduzir simultaneamente valor durativo e de tempo de calendário, optámos pelo valor durativo sempre que a formulação com "durante" em vez de "há" fosse aceitável, e por tempo de calendário nos casos em que responde exclusivamente a "(prep) quando?".

Exemplos:
  o pensamento cartesiano <EM ID="H2-bbb-231" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de há quatro séculos</EM>
  o CCB iniciava, <EM ID="Ntyr-78-400" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">há quinze anos</EM>, a sua actividade
  é um projeto que vem sendo realizado <EM ID="bob-14949-607" CATEG="TEMPO" TIPO="DURACAO">há mais de dois anos</EM>

Ausência de marcação

Não anotámos:

TEMPO estendido

Expressões compostas por data absoluta e data referencial

Nos casos em que, a expressão é composta por uma expressão com valor absoluto e outra com valor referencial (explícito), mas em que não é possível fazer a segmentação em duas expressões porque uma delas não se combina isoladamente com o predicado qe modifica, atribuímos o valor de data à entidade, mesmo que fosse possível determinar o tipo de referência e o sentido,.
Exemplos:
  <EM ID="hub-51467-348" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ENUNCIACAO" SENTIDO="POSTERIOR" VAL_DELTA="A1M0S0D0H0M0S0">a partir de Janeiro do próximo ano</EM>
 
  <EM ID="hub-18050-209" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="TEXTUAL" SENTIDO="SIMULT" VAL_DELTA="">a 30 desse mês</EM>
 
No primeiro caso, se fosse possível segmentar em duas entidades, "a partir de Janeiro" e "do próximo ano", a primeira entidade seria uma data absoluta e a segunda uma data referencial em relação ao momento da enunciação. Como não é possível fazer a segmentação, e atribuindo-se o valor de data absoluta, não é possível representar o valor referencial posterior desta entidade relativo ao momento da enunciação, nem que a data referencial deve ser incrementada de 1 ano através do preenchimento de VAL_DELTA.
Na segunda situação, se fosse possível segmentar em duas entidades, "a 30" teria valor absoluto e "desse mês" teria valor referencial textual. Este exemplo tem ainda a particularidade de "desse mês" traduzir simultaneidade com o mês que serve de referência. Ao optar por data absoluta não é possível representar esses valores.

Expressões com valor de data sem nenhum dos campos ANO-MES-DIA especificado

De acordo com as directivas, as datas com valor absoluto devem ter pelo menos explicitado um dos campos ANO-MES-DIA. No entanto, pareceu-nos que, tal como no caso de "na era dos dinossauros" que tem valor absoluto sem ter nenhum desses campos explicitados, expressões de data que não dependessem de uma referência seriam igualmente anotadas como datas absolutas.
Exemplos:
  <EM ID="hub-66526-557" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ABSOLUTO" VAL_NORM="">No início do século XVI</EM>
  <EM ID="ric-54609-190" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ABSOLUTO" VAL_NORM="">nos anos 90</EM>

Expressões com valor simultâneo

Quando o evento modificado por uma expressão com valor referencial decorre em simultâneo com um ponto mais alargado do calendário do que um dia específico, também marcámos o atributo SENTIDO com o valor SIMULT.

Exemplos:
 
  <EM ID="hub-21881-182" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ENUNCIACAO" SENTIDO="SIMULT" VAL_DELTA="">No ano</EM> que agora termina...
  <EM ID="aa33715-460" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ENUNCIACAO" SENTIDO="SIMULT" VAL_DELTA="">este ano</EM>
  segundo bebé <EM ID="hub-71248-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="TEXTUAL" SENTIDO="SIMULT" VAL_DELTA="">do ano</EM>
 
No primeiro e segundos exemplos, "ano" refere-se ao "mesmo ano do momento da enunciacao", enquanto que no terceiro exemplo "ano" refere-se ao "mesmo ano referido no texto".

Preenchimento de VAL_DELTA e VAL_NORM na ausência total de informação

Quando não existe informação que permita preencher pelo menos um dos campos de VAL_DELTA ou VAL_NORM, optámos por preencher esse atributo com o valor "", em vez de omitir o atributo.
  <EM ID="aa94781-176" CATEG="TEMPO" TIPO="DURACAO" VAL_NORM="">Há anos</EM>
  <EM ID="aa94781-192" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="TEXTUAL" SENTIDO="SIMULT" VAL_DELTA="">naquele dia</EM>

Omissões / problemas na colecção dourada final do TEMPO

Mantemos uma lista de eventuais problemas descobertos após a publicação da LÂMPADA aqui. Se encontrar problemas avise-nos, que os juntaremos à lista.


Última actualização: 11 de Março de 2009.