Segundo HAREM: Avaliação da categoria TEMPO

HAREM, Linguateca

O presente texto descreve em mais pormenor a avaliação dos atributos contemplados nas directivas apresentadas por Hagège et al. para a categoria do TEMPO no âmbito do Segundo HAREM.

A razão pela qual se apresenta uma proposta de avaliação específica para as EMs da categoria TEMPO deve-se ao facto de as directivas subjacentes ao reconhecimento destas expressões (Hagege et al.) apresentarem um conjunto de atributos mais detalhado do que as existentes no HAREM clássico e incluirem a tarefa adicional de normalização de algumas expressões temporais.

Assim, este documento descreve a pontuação/classificação dos novos atributos especificados nas directivas (nomeadamente, SENTIDO e TEMPO_REF) e dos valores relativos à tarefa de normalização (nomeadamente, VAL_NORM e VAL_DELTA).

Os participantes no Segundo HAREM que adoptarem um cenário que inclua TEMPO poderão ser avaliados de três formas distintas:

  1. HAREM clássico, tomando apenas em conta os valores CATEG, TIPO e SUBTIPO (segundo as normas descritas no modelo de avaliação geral)
  2. HAREM estendido, com informação pormenorizada sobre o TEMPO (incluindo, ou não, a componente de normalização)
  3. Medida separada para a normalização das expressões temporais.
Apresenta-se de seguida a avaliação dos vários atributos no modo de avaliação 2, incluindo a componente de normalização.

CATEG, TIPO e SUBTIPO

Avaliação idêntica aos restantes atributos do Segundo HAREM. (Apenas se assume que pode existir vagueza no caso dos atributos clássicos.)

1 + Σ(1, N) { α*(1 - 1/ num-cats )* cat-certa + β*(1 - 1/ num-tipos )* tipo-certo + γ*(1 - 1/ num-subtipos )* subtipo-certo } - Σ(1, M) {α*(1/ num-cats )* cat-espuria + β*(1/ num-tipos )* tipo-espurio + γ*(1/ num-subtipos )* subtipo-espurio }

Por cada um dos atributos TEMPO_REF, SENTIDO, VAL_DELTA e/ou VAL_NORM que estiver especificado na CD serão adicionadas as seguintes parcelas à fórmula anterior:

TEMPO_REF

valores possíveis = ABSOLUTO, TEXTUAL, ENUNCIACAO

+ δ * certo

SENTIDO

valores possíveis = ANTERIOR, POSTERIOR, SIMULT, ANTERIOR_OU_SIMULT, POSTERIOR_OU_SIMULT

+ λ * certo

VAL_DELTA

Formato: A<digitos>M<digitos>S<digitos>D<digitos>H<digitos>M<digitos>S<digitos>

+ ε * certo

O valor do atributo VAL_DELTA é considerado como certo se ao ser convertido para uma unidade mínima, o valor convertido for igual ao valor da CD após conversão para a mesma unidade. Entende-se por unidade mínima, a menor unidade usada para especificar este atributo, para a entidade em causa, na CD e na resposta do sistema. As conversões são feitas de acordo com a tabela que se encontra na adenda às directivas do TEMPO, a qual transcrevemos no fim deste documento.

VAL_NORM

Formato no caso de DURACAO:

A<digitos>M<digitos>S<digitos>D<digitos>H<digitos>M<digitos>S<digitos>

Avaliação: (igual a VAL_DELTA)

+ ε * certo

Tal como no caso de VAL_DELTA, o valor do atributo VAL_NORM para DURACAO é considerado como certo se ao ser convertido para uma unidade mínima, o valor convertido for igual ao valor da CD após conversão para a mesma unidade. Entende-se por unidade mínima, a menor unidade usada para especificar este atributo, para a entidade em causa, na CD e na resposta do sistema. As conversões são feitas de acordo com a tabela que se encontra na adenda às directivas do TEMPO, a qual transcrevemos no fim deste documento.

Formato, no caso de DATA absoluta:
<Era><Ano><Mes><Dia>T<Hora><Minuto>E<ESTACAO>LM<limite_aberto>

+ ζ * (Era-certa + Ano-certo + Dia-certo + Hora-certo + Minuto-certo + ESTACAO-certa + limite-certo)

Os vários campos são considerados como certos se forem iguais aos mesmos campos na CD. Os campos Ano, Dia, Hora e Minuto são considerados também como certos quando forem iguais a zero na resposta do sistema e indeterminados (valor igual a "--" ou "----") na CD, ou vice-versa.

Formato no caso de HORA:
+--------T<Hora><Minuto>E--LM<limite_aberto>

+ η * (Hora-certo + Minuto-certo + limite-certo)

Os vários campos são considerados como certos se forem iguais aos mesmos campos na CD. Os campos Hora e Minuto são considerados também como certos quando forem iguais a zero na resposta do sistema e indeterminados (valor igual a "--" ou "----") na CD, ou vice-versa.

Notas:

Apresentamos também um conjunto de exemplos detalhados.
Última actualização: 10 de Abril de 2008.