Hoi, In deze en deze bewerking voeg je disambig info toe aan het label. Die info hoort eigenlijk thuis in de beschrijving. Zou je daar rekening mee kunnen houden?
Topic on User talk:Edoderoo
Jump to navigation
Jump to search
Reply to "Disambig in labels"
Dat zal heel lastig gaan, want vaak hoort die info weer niet in de beschrijving, maar juist in het label. Zoals bij de miljoenen wetenschappelijke artikelen die langskomen. Een bot kan dit nooit altijd goed doen, dat blijft handwerk, en in zulke gevallen moet iemand het dus met de hand verbeteren. Alternatief is geen bot, en dan moeten we elke dag 25.000 artikelen met de hand gaan invullen en beschrijven, en dat werkt zeker niet in de praktijk. In eerste instantie liet het script alles vanaf de haakjes weg. Daar is commentaar op gekomen. Nu wordt al zo'n 2 jaar alles na het haakje weer toegevoegd, maar daar komt nu ook commentaar op. Snap je wat ik bedoel?
Ik zie nu pas dat dit niet door mij, en niet door mijn bot wordt toegevoegd, maar door de gebruikte tool die het wikidata-item aanmaakt. Als een pagina ongeveer een week geen wikidata-item heeft, of als ik deze eerder al kan koppelen, dan gebeurt dat vaak via https://nl.wikipedia.org/wiki/Gebruiker:Edoderoo/last-xxx-no-wikidata met een link naar de duplicity-tool. Hoe die tool de pagina-naam afhandelt, is buiten mijn invloedssfeer.
Ah, oké. Dat verklaart de bewerking met dit account. Maar die met je bot: je kunt toch met instance of (P31) een aardige gok doen of je het haakjesgedeelte eraf moet halen of niet? Bij wetenschappelijke artikelen niet, bij personen en geografische locaties en andere dingen bijvoorbeeld wel.
Dat haakjes weghalen ging meen ik vorige keer niet goed omdat je alles tussen haakjes weghaalde. Maar dat is een kwestie van het script aanpassen zodat die alleen het laatste deel achteraan tussen haakjes weghaalt. Dan krijg je zoiets als: text = re.sub(r' \([^)]+\)$', '', text).