[RESOLU] Parser XML sur BeautifulSoup

Questions about WAPT Packaging / Requêtes et aides autour des paquets Wapt.
Règles du forum
Règles du forum communautaire
* English support on www.reddit.com/r/wapt
* Le support communautaire en français se fait sur ce forum
* Merci de préfixer le titre du topic par [RESOLU] s'il est résolu.
* Merci de ne pas modifier un topic qui est taggé [RESOLU]. Ouvrez un nouveau topic en référençant l'ancien
* Préciser version de WAPT installée, version complète ET numéro de build (2.2.1.11957 / 2.2.2.12337 / etc.) AINSI QUE l'édition Enterprise / Discovery
* Les versions 1.8.2 et antérieures ne sont plus maintenues. Les seules questions acceptées vis à vis de la version 1.8.2 sont liés à la mise à jour vers une version supportée (2.1, 2.2, etc.)
* Préciser OS du serveur (Linux / Windows) et version (Debian Buster/Bullseye - CentOS 7 - Windows Server 2012/2016/2019)
* Préciser OS de la machine d'administration/création des paquets et de la machine avec l'agent qui pose problème le cas échéant (Windows 7 / 10 / 11 / Debian 11 / etc.)
* Eviter de poser plusieurs questions lors de l'ouverture de topic, sinon il risque d'être ignorer. Si plusieurs sujet, ouvrir plusieurs topic, et de préférence les uns après les autres et pas tous en même temps (ie ne pas spammer le forum).
* Inclure directement les morceaux de code, les captures d'écran et autres images directement dans le post. Les liens vers les pastebin, les bitly et autres sites tierces seront systématiquement supprimés.
* Comme tout forum communautaire, le support est fait bénévolement par les membres. Si vous avez besoin d'un support commercial, vous pouvez contacter le service commercial Tranquil IT au 02.40.97.57.55
jmorillo
Messages : 2
Inscription : 16 oct. 2024 - 15:26

16 oct. 2024 - 15:38

Hello hello,

J'ai besoin de créer un package "Clari Copilot" (facile, leur intaller.exe fonctionnement correctement avec du /S).
En revanche, je bute sur la fonction update_package.py car l'hébergement de binaire est sur un cdn, sans page html principale mais j'ai pu trouver une page xml listant les releases.
Dans setupdevhelpers.py, il y a la fonction bs_find et bs_find_all (qui vient appeler BeautifulSoup (bs4)) avec par défaut features="html.parser"
BeautifulSoup ainsi que les fonctions bs_find* acceptent feature="xml" sauf que BeautifulSoup a besoin de la lib python "lxml" qui n'est pas présente par défaut dans l'env virtuelle python de Wapt il me semble.
Je pourrais faire un parser crado à base de bidouille mais bon, autant utiliser bs_find* et BeautifulSoup nativement avec du XML.
Auriez-vous une astuce pour moi ? est-il prévu d'intégrer cette lib lxml dans une prochaine release ? ou peut-être suis-je passé à coté de quelque chose ?...
Merci beaucoup d'avance
Bien cordialement
Jordi
Avatar de l’utilisateur
blemoigne
Messages : 39
Inscription : 17 juil. 2020 - 11:29

16 oct. 2024 - 16:45

Bonjour Jordi,
Tu peux quand même parser le xml avec le html parser (tu auras un warning). C'est le cas de ce paquet : https://wapt.tranquil.it/store/fr/tis-0install
jmorillo
Messages : 2
Inscription : 16 oct. 2024 - 15:26

16 oct. 2024 - 18:33

Un grand merci Bertrand !
Tout fonctionne correctement !
Juste une petite galère car l'element xml était déclaré ainsi: "<Key>"

Je ne trouvais aucun résultat pour

Code : Tout sélectionner

bs_find_all('https://contoso.com/test.xml', 'Key')
Il fallait mettre Key -> key (en minuscule) dans

Code : Tout sélectionner

bs_find_all('https://contoso.com/test.xml', 'key')
pour qu'un résultat soit affiché.
En tout cas je vais pouvoir terminer la fonction update_package.
Encore un grand merci
Avatar de l’utilisateur
dcardon
Expert WAPT
Messages : 1544
Inscription : 18 juin 2014 - 09:58
Localisation : Saint Sébastien sur Loire
Contact :

17 oct. 2024 - 15:47

Salut Jordi,
merci pour ton retour :-)
je passe le topic en résolu.
Denis
Denis Cardon - Tranquil IT
Communiquez autour de vous sur WAPT! Envoyez nous vos url de blog et d'articles dans la catégorie votre avis du forum, nous les mettrons en avant sur le site WAPT
Verrouillé