Wikidata:Edit groups/OR/ea8b34ff

From Wikidata
Jump to navigation Jump to search

Edit group OR/ea8b34ff

Summary Import dataset de https://ec.europa.eu/eurostat/web/products-datasets/-/avia_tf_apal Author Bouzinac
Number of edits 569 (more statistics) Example edit Q843204

Discussion[edit]

@Bouzinac: Bravo pour cet import ! Mais attention à ne pas remplacer des descriptions existantes par des descriptions moins bien, comme dans cet edit: https://www.wikidata.org/wiki/index.php?diff=813910013&oldid=590936062Pintoch (talk) 08:32, 18 December 2018 (UTC)[reply]

Bonjour Pintoch Yes, j'avais vu ça mais trop tard... N'y a-t-il pas d'option dans openrefine du style : "ne pas écraser si une valeur existe déjà, ne rajouter que si vide" ?

Pour ce même exercice d'import, j'ai été gêné par d'autres phénomènes :

  • patronage (P3872) refuse la précision d'unités mais OpenRefine exige des unités sinon le schéma n'est pas valide...
  • J'avais des codes OACI dans le dataset mais la réconciliation n'a pas fonctionné : je pensais pouvoir faire un "recherchev." via code OACI et au final, ça a mieux fonctionné via le nom de l'aéroport que via le code OACI
  • Enfin, la réconciliation sur le nom du pays a donné des résultats parfois étranges, exemple : Roumanie est proposé avec deux noms identiques (il s'avère qu'il y a eu plusieurs "Roumanies") Bouzinac (talk) 09:26, 18 December 2018 (UTC)[reply]
@Bouzinac: Merci beaucoup pour ces retours ! Réponses au questions dans l'ordre:
  • Il n'est jamais trop tard pour améliorer un import : tu peux facilement annuler les modifications sur https://tools.wmflabs.org/editgroups/b/OR/ea8b34ff et le refaire;
  • Pour OpenRefine exige des unités sinon le schéma n'est pas valide, c'est curieux, je n'arrive pas à reproduire ce bug. Si tu crées une déclaration patronage (P3872) sans toucher à l'unité (en laissant la case vide), il me semble que ça marche.
  • Est-ce que les codes OACI étaient formatés exactement comme sur Wikidata ? Comment as-tu configuré la réconciliation ? Si tu réconcilies directement la colonne avec les codes, c'est normal que ça ne marche pas (il faut réconcilier une autre colonne et ajouter les codes en tant que propriété auxiliaire).
j'ai fait réconcilier nom aéroport + propriété code OACI sur autre colonne qui contient les OACI...
  • il s'avère qu'il y a eu plusieurs "Roumanies" malheureusement je vois pas trop ce qu'on peut y faire ?
rajouter en nom de pays 'Roumanie (de 19xx à 19xx)' pour éviter les confusions par exemple avec le pays le plus récent sans précision de dates... je vais faire une requête pour voir les "homonymies" de pays
Pintoch (talk) 10:11, 18 December 2018 (UTC)[reply]
OK, je recommencerai l'import ce soir. Tu aurais une bonne pratique pour éliminer les "description déjà remplies" / "ne rajouter que si vide" (comme dans excel copier coller spécial blancs non compris)  ? Bouzinac (talk) 10:32, 18 December 2018 (UTC)[reply]
@Bouzinac: pour l'instant la solution la plus simple pour moi est de récupérer les descriptions existantes (Dfr dans la fonction "Add columms from reconciled values"), filtrer sur les valeurs non-vides des descriptions existantes et blanchir la colonne des nouvelles descriptions dans ce cas-là. Mais je compte effectivement ajouter une option dans le schéma pour faciliter ça à l'avenir. − Pintoch (talk) 12:07, 18 December 2018 (UTC)[reply]

Bonsoir, donc nouvelle importation OR en cours et ça semble plus propre. Pour l'histoire de "passager", j'ai dû supprimer et recréer la déclaration (le simple fait de faire la croix pour vider l'unité n'a pas suffi, il a fallu ressaisir la déclaration annuelle). En revanche, je ne t'ai pas suivi sur comment afficher une colonne supplémentaire avec (? comment trouver la description fr ?)

bug open refine

Bouzinac (talk) 19:57, 18 December 2018 (UTC)[reply]

@Bouzinac: C'est presque ça: "Dfr", pas "dfr" − Pintoch (talk) 20:06, 18 December 2018 (UTC)[reply]
Ok SPARQL: Dfr

Et pour chercher le titre français de l'élément ?

Expression rationelle[edit]

bug expression rationnelle

Est ce normal que "$^" ne permette pas de filtrer les chaînes vides ? Et ne vaut-il pas mieux dire expression régulière que rationnelle? Bouzinac (talk) 20:21, 18 December 2018 (UTC)[reply]

$^ devrait sélectionner les chaines vides, mais pas les valeurs nulles (il y a une distinction entre les deux valeurs dans OpenRefine, comme dans beaucoup d'autres systèmes). Tu peux utiliser les facettes dédiées pour ça. Pour les autres termes (nom, alias) la syntaxe est "Lfr" ou "Afr", c'est documenté là: https://github.com/OpenRefine/OpenRefine/wiki/Reconciliation#labels-descriptions-aliasesPintoch (talk) 20:42, 18 December 2018 (UTC)[reply]

Preferred[edit]

Bonjour Pintoch, tu aurais une bonne pratique pour placer des valeurs en rang préféré automatiquement ? (mettre la valeur de l'année la plus récente en préferred) ? Ca permettrait au modèle WikidataOI de fonctionner et présenter uniquement la valeur ayant rang préféré. Bouzinac (talk) 14:23, 19 December 2018 (UTC)[reply]

Pour l'instant OpenRefine ne permet pas de définir des rangs - c'est quelque-chose que je voudrais ajouter dans une prochaine version. − Pintoch (talk) 23:44, 19 December 2018 (UTC)[reply]