Running on Zero MCP Featured 2.33k Wan2.2 14B Fast đ„ 2.33k generate a video from an image with a text prompt
CATIE-AQ/NERmembert-large-4entities Token Classification âą 0.3B âą Updated Nov 26, 2024 âą 298 âą 4
Jean-Baptiste/camembert-ner Token Classification âą 0.1B âą Updated Jun 1, 2023 âą 145k âą âą 118
view post Post 877 Ton LLM (ou devrais-je dire gml) est impressionnant⊠jusquâĂ ce quâil te fasse risquer 5 ans de prison pour une erreur de conformitĂ©.?Aujourdâhui, legml.ai publie la premiĂšre Ă©valuation openâsource des modĂšles dâIA sur le droit des affaires français.Et en mĂȘme temps, le benchmark le plus complet:"Les Audits Affaires Leadboard"Pendant que beaucoup se contentent de dire que leur LLM "parle bien français", nous nous sommes questionnĂ©s : âą Estâce quâil sait Ă©viter un redressement fiscal ? ConnaĂźtâil les dĂ©lais URSSAF, les pĂ©nalitĂ©s TVA, ou les rĂšgles DORAâŻ2025 ? âą Tu lui ferais confiance pour structurer une clause de cession dâactions ?Dans 41âŻ% des cas, la rĂ©ponse est non.Hallucinations, seuils erronĂ©s, articles inventĂ©s, procĂ©dures fictives.Quand un modĂšle se trompe en droit, câest un risque rĂ©el.Câest pourquoi nous avons construit lesâauditsâaffaires, un benchmark qui reflĂšte la complexitĂ© concrĂšte des enjeux juridiques et financiers des entreprises françaises.â 2âŻ670 cas mĂ©tiers rĂ©alistes : questions posĂ©es par des DAF, juristes, comptables, RH, dirigeants.â 9 codes juridiques analysĂ©s (commercial, fiscal, travail, bancaire, consommationâŠ)â 5 dimensions dâĂ©valuation : action, dĂ©lai, documents, impact financier, risques juridiques.Mais on ne sâest pas contentĂ©s dâun score.Pour chaque modĂšle Ă©valuĂ©, vous avez accĂšs Ă un rapport complet Ă https://lnkd.in/dBqKR7YZ : texte du modĂšle vs. groundâtruth lĂ©gal, score dĂ©taillĂ©, et justification article par article.Câest transparent. Câest prĂ©cis. Câest vĂ©rifiable.Explorez dĂšs maintenant : âą Leaderboard â @les-audites-affaires-leadboard âą Dataset â legmlai/les-audits-affaires âą Eval harness â https://github.com/legml-ai/les-audits-affaires-eval-harness âą Article Huggingface : https://lnkd.in/dTHYKuzrEnvie de confronter votre modĂšle ? On publie vos rĂ©sultats See translation đ 3 3 + Reply
view article Article Les-Audits-Affaires: The First Comprehensive French Buisness Legal AI Benchmark Jun 25 âą 2