Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Elementos <volume>, <issue>, <fpage> e <lpage> não são inseridos no formato *xmlrsps* #195

Closed
gustavofonseca opened this issue Dec 6, 2019 · 4 comments
Assignees
Labels
bug Something isn't working

Comments

@gustavofonseca
Copy link
Contributor

O registro do documento S0253-570X2018000100010, da coleção cubana contém os metadados suficientes para que sejam representados utilizando os campos <volume>, <issue>, <fpage> e <lpage> quando no formato xmlrsps, entretanto os elementos não constam no XML produzido.

@gustavofonseca gustavofonseca added the bug Something isn't working label Dec 6, 2019
@joffilyfe
Copy link
Contributor

Em uma primeira análise consegui detectar a fonte de parte do problema. Os campos de <issue> e <volume> são inseridos no pipeline XMLArticleMetaIssueInfoPipe, tenta-se acessar o elemento .issue do documento mas ele não existe e a provável causa é de que o elemento não foi carregado durante o processamento (isis2mongo talvez).

Acontece que não é necessário olhar para o objeto issue dentro do objeto article, as informações sobre os dados de volume e número já estão carregados no próprio article. É possível confirmar essa informação pelo documento Dicionário de dados do modelo SciELO na página 48.

Exemplo de verificação:

curl http://articlemeta.scielo.org/api/v1/article/\?collection\=cub\&code\=S0253-570X2018000100010 -q | jq ".article.v31"                                                                                                                                                              
[
  {
    "_": "40"
  }
]
curl http://articlemeta.scielo.org/api/v1/article/\?collection\=cub\&code\=S0253-570X2018000100010 | jq ".article.v32"                                                                                                                                                                 

[
  {
    "_": "1"
  }
]

Os campos fpage lpages também existe no objeto article.

curl http://articlemeta.scielo.org/api/v1/article/\?collection\=cub\&code\=S0253-570X2018000100010 | jq ".article.v14"

[
  {
    "f": "00",
    "l": "00",
    "_": ""
  }
]

Mas ao acessarmos o raw.start_page e raw.end_page o xylose retorna None se a página for 0, o que é o caso desse artigo.

Se esta regra for válida então não há um problema de fato no articles_meta. O que vocês acham @patymori @robertatakenaka @gustavofonseca @jamilatta ?

@gustavofonseca
Copy link
Contributor Author

@joffilyfe, excelente análise. À primeira vista a implementação está equivocada ao exigir a presença do atributo .issue, como você bem descreveu.

Mas ao acessarmos o raw.start_page e raw.end_page o xylose retorna None se a página for 0, o que é o caso desse artigo.

Se esta regra for válida então não há um problema de fato no articles_meta. O que vocês acham @patymori @robertatakenaka @gustavofonseca @jamilatta ?

Você se refere à regra do xylose?

@joffilyfe
Copy link
Contributor

@joffilyfe, excelente análise. À primeira vista a implementação está equivocada ao exigir a presença do atributo .issue, como você bem descreveu.

Mas ao acessarmos o raw.start_page e raw.end_page o xylose retorna None se a página for 0, o que é o caso desse artigo.
Se esta regra for válida então não há um problema de fato no articles_meta. O que vocês acham @patymori @robertatakenaka @gustavofonseca @jamilatta ?

Você se refere à regra do xylose?

Sim, exatamente.

@joffilyfe
Copy link
Contributor

@joffilyfe, excelente análise. À primeira vista a implementação está equivocada ao exigir a presença do atributo .issue, como você bem descreveu.

Mas ao acessarmos o raw.start_page e raw.end_page o xylose retorna None se a página for 0, o que é o caso desse artigo.
Se esta regra for válida então não há um problema de fato no articles_meta. O que vocês acham @patymori @robertatakenaka @gustavofonseca @jamilatta ?

Você se refere à regra do xylose?

Sim, exatamente.

Conversando com a equipe @scieloorg/scielo-brazil-developers ficou claro que a regra aplicada às propriedades start_page e end_page pelo xylose está correta. O valor 00 deve ser tratado como None porque na base article o preenchimento deste campo é obrigatório, sendo assim recomenda-se o seu preenchimento com 00 para indicar a não presença de páginas.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

5 participants