SentenceTransformer based on EuroBERT/EuroBERT-210m
This is a sentence-transformers model finetuned from EuroBERT/EuroBERT-210m on the matching_rh_val5 dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: EuroBERT/EuroBERT-210m
- Maximum Sequence Length: 8192 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
- Training Dataset:
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False, 'architecture': 'EuroBertModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("gguichard/matching-rh-gooaq-peft")
# Run inference
sentences = [
'{"type": "opportunity", "opportunity_title": "PMO Raw Material Strategy", "opportunity_place": "", "opportunity_expertise_area": "industrie pharmaceutique", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "Au sein du CoE mRNA et dans le cadre de la qualification des nouvelles matières premières mRNA, la prestation consiste a supporter le responsable RM program dans l’établissement de la stratégie \\n-\\tGestion de projet\\n-\\tEtablissement de la roadmap \\n-\\tMise en place des indicateurs \\n-\\tPilotage des budgets\\nLIVRABLES\\nA définir : Roadmap RM Strategy & KPI\\nEcheance 15/01/2024", "opportunity_criteria": "Bonjour Monsieur Thevenet \\nJe ne sais pas si vous avez vu sur Fielglass l’appel d’offre SPTQ00030223\\nNous recherchons un profil type école de commerce , achat pour une mission de 6 mois a commencé le 1 juillet", "opportunity_extract": 1, "customer_code": ""}',
'{"type": "candidate", "title": "CV envoyé par HelloWork. Contient des données personnelles : ne pas utiliser, diffuser, copier sans le consentement de son auteur.", "skills": "atg, tpr, dsc, fx, drx, clhp, cpg, ccm, ci, uv-visible, rmn, icp, ir, sm, hg, meb, charpy, ms, excel, word, powerpoint, sap, internet, linkedin, gc, hplc, ltip, hplc-uv, hplc-ms, gc-fid, hg, h2/o2, tpr, meb\\n\\npréparation d’échantillons, extraction, métrologie, validation de méthodes, analyses mécaniques", "experience": "6", "education": "Bac3", "experiences": "[{\'skills\': \'\', \'startMonth\': \'\', \'endDate\': \'\', \'startYear\': \'\', \'description\': \'•\\\\nASCOTEC (fabrication d’additifs anti-corrosion) - Saint-Étienne (42) ; stage de fin d’études\', \'company\': \'ASCOTEC\', \'location\': \'Saint-Étienne\', \'id\': \'32227\', \'title\': \'stage de fin d’études\', \'endMonth\': \'\', \'endYear\': \'\', \'startDate\': \'\'}, {\'skills\': \'meb\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2015\', \'description\': \'•\\\\n: JTEKT - Irigny (69) : technicien de laboratoire : contrôles traitements thermiques, essais de validation pour la mise en\\\\nproduction de nouveaux projets, gestion d’une partie de la production de l’entreprise, tests de dureté, examens métallurgique s,\\\\nMEB, pollution.\', \'company\': \'JTEKT\', \'location\': \'\', \'id\': \'32228\', \'title\': \'technicien de laboratoire\', \'endMonth\': \'12\', \'endYear\': \'2015\', \'startDate\': \'\'}, {\'skills\': \'\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2016\', \'description\': \'•\\\\n- : ADHEX TECHNOLOGIES (fabrication d’adhésifs) - Chenôve (21) en alternance : étude des durées de vie des\\\\nproduits chimiques utilisés dans la formulation d’adhésifs, optimisation de leurs péremptions, mise en place d’un appareil de\\\\ndéchirement (réception, création d’une procédure de vérification et d’utilisation de l’appareil), tests physico-chimiques\', \'company\': \'ADHEX TECHNOLOGIES\', \'location\': \'\', \'id\': \'32229\', \'title\': \'\', \'endMonth\': \'1\', \'endYear\': \'2017\', \'startDate\': \'\'}, {\'skills\': \'hg, h2/o2, tpr\', \'startMonth\': \'11\', \'endDate\': \'\', \'startYear\': \'2017\', \'description\': \'•\\\\n- : IFPEN – Solaize (69) ; technicien en caractérisation texturale de matériaux\\\\ncatalytiques : physisorption azote et krypton, porosimétrie Hg, chimisorption H2/O2, TPR, granulométrie laser, essais\\\\nmécaniques\', \'company\': \'IFPEN\', \'location\': \'Solaize\', \'id\': \'32230\', \'title\': \'technicien en caractérisation\', \'endMonth\': \'12\', \'endYear\': \'2018\', \'startDate\': \'\'}, {\'skills\': \'hplc-uv, hplc-ms, gc-fid\', \'startMonth\': \'4\', \'endDate\': \'\', \'startYear\': \'2019\', \'description\': \'•\\\\n- : NOVASEP – Chasse-sur-Rhône (69) ; analyste\\\\nR&D : analyses sur HPLC-UV, HPLC-MS, GC-FID, développement de méthodes d’analyses\', \'company\': \'NOVASEP\', \'location\': \'Chasse-sur-Rhône\', \'id\': \'32231\', \'title\': \'analyste\', \'endMonth\': \'12\', \'endYear\': \'2019\', \'startDate\': \'\'}, {\'skills\': \'\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2020\', \'description\': \'•\\\\n– : JTEKT - Irigny (69) : technicien de\\\\nlaboratoire : dureté, microstructures, développement de méthodes\\\\nd’analyses\', \'company\': \'JTEKT\', \'location\': \'\', \'id\': \'32232\', \'title\': \'technicien de laboratoire\', \'endMonth\': \'6\', \'endYear\': \'2021\', \'startDate\': \'\'}, {\'skills\': \'hplc, ltip\', \'startMonth\': \'2\', \'endDate\': \'\', \'startYear\': \'2022\', \'description\': \'•\\\\n– : SANOFI Gerland : technicien CQ : analyses\\\\nprotéines par HPLC, LTIP\', \'company\': \'SANOFI Gerland\', \'location\': \'\', \'id\': \'32233\', \'title\': \'technicien CQ\', \'endMonth\': \'3\', \'endYear\': \'2022\', \'startDate\': \'\'}, {\'skills\': \'gc\', \'startMonth\': \'8\', \'endDate\': \'\', \'startYear\': \'2022\', \'description\': \'•\\\\n– : EXPLORAIR – Chasse-sur-Rhône (38) :\\\\ntechnicien site : prélèvements sur sites biométhane, analyses par GC\', \'company\': \'EXPLORAIR\', \'location\': \'Chasse-sur-Rhône\', \'id\': \'32234\', \'title\': \'technicien site\', \'endMonth\': \'12\', \'endYear\': \'2022\', \'startDate\': \'\'}]", "tools": "", "languages": "english,español", "mobility": "", "expertise_area": "industrie pharmaceutique,industrie chimique,industrie automobile,petrolegazeau", "activity_area": "chimie,caracterisationformulation,rd", "list_diplomes": "2017 - Licence professionnelle techniques analytiques - IUT de Lyon 1,2014 - DUT chimie option matériaux - IUT,2012 - Prépa concours manipulateur radio - Poly,2011 - Baccalauréat Scientifique option physique-chimie - lycée Sainte-Marie la Grand’Grange", "typeOf": "-1", "source": "-1", "informationComments": "", "extract": 1}',
'{"type": "candidate", "title": "Ingénieure Qualité", "skills": "aisance relationnelle, capacité de calme, capacité de remise en question, capacité de résilience, complimente, créative, exigeante, flexible, honnête, méthodique, polie, réfléchie, sens de l’écoute, valorise\\n\\n21g, 5m, 5s, adobe acrobat, adr, aic, amadeo, amdec, amdec produit, aqf, bbs, bpc, bpf, calendar, canva, capa, ccmx, charte open space, cornerstone, dd, disc, dmaic, docusign, drive, dropbox, en9100, flash, ftp, gantt project, ged, gerep, google sheet, haccp, hse, im8000, iso, iso13485, iso14001, kpi, linkedin learning, nc, odoo, office13, office2013, office2021, office365, onedrive, pdf reader, photoshop, podcasts, power bi, ppap, prap, qc, qqoqcp, qse, qualitysaas, r&r, règlement dm, sap, sharepoint, silog, teams, tests r&r, visio, wrike, zip, zoom, 21g, 5s, amdec, aqf, bpf, capa, charte open space, en9100, ged, im8000, iso13485, kpi, office13, ppap, qc, qse, r&r, sap, tests r&r, adr, bbs, dd, haccp, iso14001, prap, 5s\\n\\naccompagnement des parties intéressées, analyse des processus, animer des 8d internes, former 1 ouvrière, assurer le suivi des plans d’actions correctives et d’amélioration, audit de poste, auditer les dossiers de lots concernant les bpd, code de l’environnement, communication interne externe, définir des indicateurs de qualité, nc, bpc les piloter et en assurer le suivi, elaborer 1 tcd hebdo, reporting pour suivi audits et reporting sprint meeting, elaborer des indicateurs de suivi de la qualité, elaborer des outils qualité, gestion de budget, contrat, gestion de crise, gestion des tests laboratoires, gérer 250 réclamations clients des produits semi finis dm classiia classiib classiii, gérer des projets qualité intégralement, gérer la base documentaire, gérer les tests brouillards salins, gérer les échantillons initiaux, lecture de plans industriels, qc, test, 8d, manager la référente qualité des 4 usines internationales, manager une équipe de 8 contrôleuses qualité, mener la veille règlementaire, mener les revues de direction, mener l’ensemble des plans d’actions de l’arrêté préfectoral, mettre à jour 3 documents uniques, et mener les plans d’actions, mise en place de formation, mise à jour d’1 analyse environnementale, optimisation de service, optimiser le service de contrôle qualité de sous-traitance -70% de qc, optimiser le service métrologie, organiser mes formations suivant le programme cornerstone, communication anglais par teams, organiser, planifier et mettre en œuvre des audits, outils de communication et management, participer au lancement des nouveaux produits en validant la conformité, piloter et animer cinquante 8d et les traduire, planifier, suivre et progresser le projet, pratiquer des outils de management, production lean, proposer des axes d’amélioration continue, qualification et évaluation de 25 fournisseurs et 1 audit, rechercher et mener les actions de la veille réglementaire, réaliser 1 cotation des aspects et impacts environnementaux, réaliser 1 indicateur type tcd des non-conformité, réaliser le support de formation, rédiger 10 dossiers techniques, rédiger les politiques qualité, se, manuel qualité, sourcing, sourcing lean, suivi d’audit, techniques audits internes, utiliser des outils de communication interne, vérifier 10 dossiers de lots par jour des dm classiib", "experience": "-1", "education": "", "experiences": "[{\'skills\': \'5s\', \'startMonth\': \'2\', \'endDate\': \'\', \'startYear\': \'2005\', \'description\': \'Chargé Amélioration continue\\\\n5 - 0 : ARMAPEX - APEX - TTI (Expatriée Vietnam)\\\\n5 - 0 : ARMAPEX - APEX - TTI (Expatriée Vietnam)\\\\n- : ARMAPEX - APEX - TTI (Expatriée Vietnam)\\\\nPiloter les 5S (3 usines en 5S)\\\\nRédiger 10 dossiers techniques (Textile)\\\\nDéfinir des indicateurs de qualité, NC, BPC les piloter et en assurer le suivi (ST : LVMH Lancel)\\\\nAssurer le suivi des plans d’actions correctives et d’amélioration\\\\nParticiper au lancement des nouveaux produits en validant la conformité\\\\nManager une équipe de 8 contrôleuses qualité\', \'company\': \'ARMAPEX\', \'location\': \'\', \'id\': \'34635\', \'title\': \'Chargé Amélioration continue\', \'endMonth\': \'2\', \'endYear\': \'2010\', \'startDate\': \'\'}, {\'skills\': \'adr, bbs, dd, haccp, iso14001, prap\', \'startMonth\': \'10\', \'endDate\': \'\', \'startYear\': \'2010\', \'description\': \\"ROSSETTO CDD (1 an) : Responsable Qualité\\\\nMise en œuvre de l’ISO9001 sur un site novice en toute autonomie\\\\nManager une équipe de 5 personnes\\\\nManager la référente qualité des 4 usines internationales\\\\nRépondre à l\'audit client : +30% de conformité obtenue\\\\nOI MANUFACTURING (1an) GROUPE : Ingénieur Environnement\\\\nMise à jour d’1 analyse environnementale\\\\nRéaliser 1 cotation des aspects et impacts environnementaux, DIB, DD...\\\\nMener l’ensemble des plans d’actions de l’arrêté préfectoral ICPEA\\\\nPlanifier, suivre et progresser le projet de l’ISO14001\\\\nRechercher et mener les actions de la veille réglementaire, AMADEO\\\\nZIEGLER (2ans) GROUPE: Animatrice QHSE\\\\nRédiger les politiques Qualité, SE, Manuel Qualité\\\\nMener les revues de direction\\\\nGérer 5000 documents ISO9001\\\\nRéaliser le support de formation à l’ADR, BBS, HACCP, PRAP\\\\nCertifications ISO 9001, SQAS 6 agences certifiées\\\\nMettre à jour 3 documents uniques, et mener les plans d’actions\\\\nCoordinateur QHSE\\\\n0 - 6 : ZIEGLER - OI MANUFACTURING - ROSSETTO\\\\n0 - 6 : ZIEGLER - OI MANUFACTURING - ROSSETTO\\\\n- : ZIEGLER - OI MANUFACTURING - ROSSETTO\\", \'company\': \'ZIEGLER\', \'location\': \'ROSSETTO\', \'id\': \'34636\', \'title\': \'OI MANUFACTURING\', \'endMonth\': \'11\', \'endYear\': \'2016\', \'startDate\': \'\'}, {\'skills\': \'21g, 5s, amdec, aqf, bpf, capa, charte open space, en9100, ged, im8000, iso13485, kpi, office13, ppap, qc, qse, r&r, sap, tests r&r\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2017\', \'description\': \'Limatech Start-Up (7,5mois) CDI :\\\\nResponsable Qualité :\\\\nSuivi des CAPA pour le renouvellement de certifications part21G, EN9100.\\\\nElaborer 1 TCD hebdo, reporting pour suivi audits et reporting sprint meeting.\\\\nQualification et évaluation de 25 fournisseurs et 1 audit EN9100.\\\\nMise en place de formation IM8000, pour backup sécurisation du QC, charte open space.\\\\nChargée Qualité : AQF +QSE +5S +Métrologie +GED +Contrats Prestataires +Achats\\\\nSupport direct à la direction : outils de communication et management\\\\nMEDTRONIC PME (11mois) CDD :\\\\n+40% du site formé à l’ISO13485, au règlement 2017/745, aux BPF, Politique Groupe\\\\nAuditer les dossiers de lots concernant les BPD, audit de poste, tests R&R, contrat, sourcing\\\\nAugmentation du KPI : 95 % de conformité sur la partie formation, échanger en anglais avec teams\\\\nOrganiser mes formations suivant le programme Cornerstone, communication anglais par teams\\\\nOptimiser le service Métrologie, -40% d’activité, réaliser le 5S, Vérifier les 900 équipements\\\\nRédiger 1 plan de transition sur 4 semaines avec 100 tâches et former au poste du remplaçant\\\\nARAYMOND PME (9 mois) CDD :\\\\nOptimiser le service de contrôle qualité de sous-traitance -70% de QC\\\\nVérifier 50 dossiers PPAP des sous traitants (AMDEC, R&R, Test...) IATF\\\\nGérer les tests brouillards salins, gérer les échantillons initiaux\\\\nRéaliser 1 indicateur type TCD des non-conformité\\\\nAnimer des 8D internes, former 1 ouvrière à Office13, SAP, Lecture de plans industriels, QC, test, 8D\\\\nMINITUBES PME CDI - DENTSPLY PME CDD : (2,5 ans)\\\\nGérer 250 réclamations clients des produits Semi finis DM ClassIIa ClassIIb classIII\\\\nVérifier 10 dossiers de lots par jour des DM classIIb\\\\nPiloter et animer cinquante 8D et les traduire en anglais\\\\nAnimer 750 réunions de suivi de CAPA en 2 ans et 5 conf call clients USA en anglais\\\\nRépondre à 1 audit ISO13485 partie satisfaction clients\\\\nCoordinateur Qualité\\\\n7 - 4 : MINITUBES - DENTSPLY - ARAYMOND - MEDTRONIC\\\\n7 - 4 : MINITUBES - DENTSPLY - ARAYMOND - MEDTRONIC\\\\n- : MINITUBES - DENTSPLY - ARAYMOND - MEDTRONIC\', \'company\': \'MINITUBES\', \'location\': \'\', \'id\': \'34637\', \'title\': \'Coordinateur Qualité\', \'endMonth\': \'7\', \'endYear\': \'2024\', \'startDate\': \'\'}]", "tools": "", "languages": "anglais,français,vietnamien", "mobility": "", "expertise_area": "", "activity_area": "", "list_diplomes": "2024 - Certification Yellow Belt Lean Management BAC+4/5 - XLGROUP,2020 - Certification management d\'équipe BAC+4/5,2014 - Licence Coordinateur qualité système BAC+3 - IUT MONTPELLIER II,2014 - Licence gestion industrielle BAC+3 - IUT NIMES,2010 - Certification RNCP Animateur QSE BAC+2 - CESI STRASBOURG", "typeOf": "-1", "source": "0", "informationComments": "", "extract": 1}',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 0.1407, 0.0456],
# [0.1407, 1.0000, 0.3780],
# [0.0456, 0.3780, 1.0000]])
Training Details
Training Dataset
matching_rh_val5
- Dataset: matching_rh_val5 at 81797ca
- Size: 62,850 training samples
- Columns:
label,sentence1, andsentence2 - Approximate statistics based on the first 1000 samples:
label sentence1 sentence2 type float string string details - min: 0.0
- mean: 0.22
- max: 1.0
- min: 82 tokens
- mean: 297.31 tokens
- max: 1664 tokens
- min: 85 tokens
- mean: 1005.62 tokens
- max: 4853 tokens
- Samples:
label sentence1 sentence2 1.0{"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""}{"type": "candidate", "title": "Senior Consultant/Project Manager - Data Management", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Avril ❖Mission : * Automatisation et fiabilisation des calculs de l'inventaire de réassurance sur les produits de prévoyance individuelle commercialisés par les partenaires d'Axa France (SAS/SQL) * Etude de l'efficience et de la rentabilité des traités de réassurance mis en place pour sécuriser le portefeuille de ces produits (SAS/C++). laureline@itconsultants.fr 8 Laure-Line Gautun 06 03 68 52 31 WWW.ITCONSULTANTS.FR ❖ Réalisations : * Etudes techniques : - Réalisation d'un cahier des charges listant les données nécessaires pour les calculs de l'inventaire et de la rentabilité des traités de réassurance - Validation des spécifications fonctionnelles de la MOA et recette métier - Automatisation des calculs et des contrôles sur les comptes d'inventaire de...0.0{"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""}{"type": "candidate", "title": "CHEF DE PROJETS", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': 'ADMINISTRATION ET OPTIMISATION DES PERFORMANCES DES BASES DE DONNÉES (ORACLE ET SQLSERVER) DE PROD ET PREPROD FORMÉS DE PLUS DE 450 SERVEURS (WIN2K3, SOLARIS, AIX.) POUR LES DEUX CLIENTS GEFCO ET CANAL PLUS', 'company': '', 'location': '', 'id': '1913', 'title': 'INGENIEUR DBA - ATOS ORIGIN - 01/01/2009 - 01/01/2011', 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "CONSEIL Les eaux minérales d'oulmes - pILOTAGE PROJET PILOTAGE DES PROJETS INFORMATIQUES : SUIVI BUDGÉTAIRE, PLANIFICATION, GESTION DES ÉQUIPES GESTION DES APPELS D'OFFRE ET LES RELATIONS AVEC LES PRESTATAIRES.", 'company': '', 'location': '', 'id': '1914', 'title': 'SCRUM MASTER, PRODUCT OWNER - PILOTAGE DES PROJETS INFORMATIQUES - 01/01/2016 - 0...0.0{"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""}{"type": "candidate", "title": "ANALYSTE MAINFRAME", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Maitrise d'œuvre : mission de maintenance corrective et évolutive de l'application informatique ETC - gestion des contrats télématiques entreprises * Analyse des spécifications fonctionnelles * Etudes techniques, études d'impact, chiffrage * Rédaction des spécifications techniques détaillées * Développement, tests unitaires et d'intégration * Rédaction des livrables : dossiers de tests, dossiers d'exploitation * Suivi de production, résolution d'incidents, assistance à utilisateur Environnement technique : MVS, TSO, COBOL, JCL, DB2, DL1, IMS, ENDEVOR", 'company': '', 'location': '', 'id': '1907', 'title': "Ingénieur d'études - Prestation BNP Paribas - 01/01/2009 - 01/01/2012", 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear'... - Loss:
CosineSimilarityLosswith these parameters:{ "loss_fct": "torch.nn.modules.loss.MSELoss" }
Evaluation Dataset
matching_rh_val5
- Dataset: matching_rh_val5 at 81797ca
- Size: 62,850 evaluation samples
- Columns:
label,sentence1, andsentence2 - Approximate statistics based on the first 1000 samples:
label sentence1 sentence2 type float string string details - min: 0.0
- mean: 0.22
- max: 1.0
- min: 82 tokens
- mean: 297.31 tokens
- max: 1664 tokens
- min: 85 tokens
- mean: 1005.62 tokens
- max: 4853 tokens
- Samples:
label sentence1 sentence2 1.0{"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""}{"type": "candidate", "title": "Senior Consultant/Project Manager - Data Management", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Avril ❖Mission : * Automatisation et fiabilisation des calculs de l'inventaire de réassurance sur les produits de prévoyance individuelle commercialisés par les partenaires d'Axa France (SAS/SQL) * Etude de l'efficience et de la rentabilité des traités de réassurance mis en place pour sécuriser le portefeuille de ces produits (SAS/C++). laureline@itconsultants.fr 8 Laure-Line Gautun 06 03 68 52 31 WWW.ITCONSULTANTS.FR ❖ Réalisations : * Etudes techniques : - Réalisation d'un cahier des charges listant les données nécessaires pour les calculs de l'inventaire et de la rentabilité des traités de réassurance - Validation des spécifications fonctionnelles de la MOA et recette métier - Automatisation des calculs et des contrôles sur les comptes d'inventaire de...0.0{"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""}{"type": "candidate", "title": "CHEF DE PROJETS", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': 'ADMINISTRATION ET OPTIMISATION DES PERFORMANCES DES BASES DE DONNÉES (ORACLE ET SQLSERVER) DE PROD ET PREPROD FORMÉS DE PLUS DE 450 SERVEURS (WIN2K3, SOLARIS, AIX.) POUR LES DEUX CLIENTS GEFCO ET CANAL PLUS', 'company': '', 'location': '', 'id': '1913', 'title': 'INGENIEUR DBA - ATOS ORIGIN - 01/01/2009 - 01/01/2011', 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "CONSEIL Les eaux minérales d'oulmes - pILOTAGE PROJET PILOTAGE DES PROJETS INFORMATIQUES : SUIVI BUDGÉTAIRE, PLANIFICATION, GESTION DES ÉQUIPES GESTION DES APPELS D'OFFRE ET LES RELATIONS AVEC LES PRESTATAIRES.", 'company': '', 'location': '', 'id': '1914', 'title': 'SCRUM MASTER, PRODUCT OWNER - PILOTAGE DES PROJETS INFORMATIQUES - 01/01/2016 - 0...0.0{"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""}{"type": "candidate", "title": "ANALYSTE MAINFRAME", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Maitrise d'œuvre : mission de maintenance corrective et évolutive de l'application informatique ETC - gestion des contrats télématiques entreprises * Analyse des spécifications fonctionnelles * Etudes techniques, études d'impact, chiffrage * Rédaction des spécifications techniques détaillées * Développement, tests unitaires et d'intégration * Rédaction des livrables : dossiers de tests, dossiers d'exploitation * Suivi de production, résolution d'incidents, assistance à utilisateur Environnement technique : MVS, TSO, COBOL, JCL, DB2, DL1, IMS, ENDEVOR", 'company': '', 'location': '', 'id': '1907', 'title': "Ingénieur d'études - Prestation BNP Paribas - 01/01/2009 - 01/01/2012", 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear'... - Loss:
CosineSimilarityLosswith these parameters:{ "loss_fct": "torch.nn.modules.loss.MSELoss" }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy: stepslearning_rate: 2e-05num_train_epochs: 1warmup_ratio: 0.1bf16: True
All Hyperparameters
Click to expand
overwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 8per_device_eval_batch_size: 8per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Truefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters:auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}
Training Logs
Click to expand
| Epoch | Step | Training Loss | Validation Loss |
|---|---|---|---|
| 0.0001 | 1 | 0.3954 | - |
| 0.0032 | 25 | 0.3749 | - |
| 0.0064 | 50 | 0.3615 | - |
| 0.0095 | 75 | 0.2741 | - |
| 0.0127 | 100 | 0.218 | - |
| 0.0159 | 125 | 0.2086 | - |
| 0.0191 | 150 | 0.1582 | - |
| 0.0223 | 175 | 0.1871 | - |
| 0.0255 | 200 | 0.1709 | - |
| 0.0286 | 225 | 0.1296 | - |
| 0.0318 | 250 | 0.1723 | - |
| 0.0350 | 275 | 0.1139 | - |
| 0.0382 | 300 | 0.1458 | - |
| 0.0414 | 325 | 0.1677 | - |
| 0.0445 | 350 | 0.1644 | - |
| 0.0477 | 375 | 0.1359 | - |
| 0.0509 | 400 | 0.1168 | - |
| 0.0541 | 425 | 0.184 | - |
| 0.0573 | 450 | 0.139 | - |
| 0.0605 | 475 | 0.1702 | - |
| 0.0636 | 500 | 0.1255 | - |
| 0.0668 | 525 | 0.1227 | - |
| 0.0700 | 550 | 0.1454 | - |
| 0.0732 | 575 | 0.1411 | - |
| 0.0764 | 600 | 0.1208 | - |
| 0.0795 | 625 | 0.1262 | - |
| 0.0827 | 650 | 0.1042 | - |
| 0.0859 | 675 | 0.1367 | - |
| 0.0891 | 700 | 0.142 | - |
| 0.0923 | 725 | 0.1295 | - |
| 0.0955 | 750 | 0.1326 | - |
| 0.0986 | 775 | 0.1237 | - |
| 0.1018 | 800 | 0.1316 | - |
| 0.1050 | 825 | 0.1289 | - |
| 0.1082 | 850 | 0.1357 | - |
| 0.1114 | 875 | 0.1107 | - |
| 0.1145 | 900 | 0.1098 | - |
| 0.1177 | 925 | 0.1079 | - |
| 0.1209 | 950 | 0.1003 | - |
| 0.1241 | 975 | 0.0961 | - |
| 0.1273 | 1000 | 0.1198 | 0.1112 |
| 0.1305 | 1025 | 0.1322 | - |
| 0.1336 | 1050 | 0.1176 | - |
| 0.1368 | 1075 | 0.1329 | - |
| 0.1400 | 1100 | 0.1038 | - |
| 0.1432 | 1125 | 0.1118 | - |
| 0.1464 | 1150 | 0.1131 | - |
| 0.1495 | 1175 | 0.1052 | - |
| 0.1527 | 1200 | 0.1149 | - |
| 0.1559 | 1225 | 0.12 | - |
| 0.1591 | 1250 | 0.1026 | - |
| 0.1623 | 1275 | 0.134 | - |
| 0.1655 | 1300 | 0.1213 | - |
| 0.1686 | 1325 | 0.1069 | - |
| 0.1718 | 1350 | 0.1108 | - |
| 0.1750 | 1375 | 0.1318 | - |
| 0.1782 | 1400 | 0.1159 | - |
| 0.1814 | 1425 | 0.0815 | - |
| 0.1845 | 1450 | 0.1155 | - |
| 0.1877 | 1475 | 0.1148 | - |
| 0.1909 | 1500 | 0.1036 | - |
| 0.1941 | 1525 | 0.1033 | - |
| 0.1973 | 1550 | 0.0707 | - |
| 0.2005 | 1575 | 0.1171 | - |
| 0.2036 | 1600 | 0.1181 | - |
| 0.2068 | 1625 | 0.1126 | - |
| 0.2100 | 1650 | 0.0714 | - |
| 0.2132 | 1675 | 0.1124 | - |
| 0.2164 | 1700 | 0.104 | - |
| 0.2195 | 1725 | 0.1035 | - |
| 0.2227 | 1750 | 0.1149 | - |
| 0.2259 | 1775 | 0.089 | - |
| 0.2291 | 1800 | 0.1206 | - |
| 0.2323 | 1825 | 0.1079 | - |
| 0.2355 | 1850 | 0.0865 | - |
| 0.2386 | 1875 | 0.1134 | - |
| 0.2418 | 1900 | 0.1151 | - |
| 0.2450 | 1925 | 0.0779 | - |
| 0.2482 | 1950 | 0.1002 | - |
| 0.2514 | 1975 | 0.1151 | - |
| 0.2546 | 2000 | 0.1104 | 0.0939 |
| 0.2577 | 2025 | 0.1 | - |
| 0.2609 | 2050 | 0.1214 | - |
| 0.2641 | 2075 | 0.095 | - |
| 0.2673 | 2100 | 0.0876 | - |
| 0.2705 | 2125 | 0.094 | - |
| 0.2736 | 2150 | 0.1177 | - |
| 0.2768 | 2175 | 0.086 | - |
| 0.2800 | 2200 | 0.0806 | - |
| 0.2832 | 2225 | 0.1003 | - |
| 0.2864 | 2250 | 0.0876 | - |
| 0.2896 | 2275 | 0.1012 | - |
| 0.2927 | 2300 | 0.0809 | - |
| 0.2959 | 2325 | 0.0913 | - |
| 0.2991 | 2350 | 0.0935 | - |
| 0.3023 | 2375 | 0.0876 | - |
| 0.3055 | 2400 | 0.0712 | - |
| 0.3086 | 2425 | 0.085 | - |
| 0.3118 | 2450 | 0.0965 | - |
| 0.3150 | 2475 | 0.0962 | - |
| 0.3182 | 2500 | 0.0931 | - |
| 0.3214 | 2525 | 0.1121 | - |
| 0.3246 | 2550 | 0.0881 | - |
| 0.3277 | 2575 | 0.096 | - |
| 0.3309 | 2600 | 0.0893 | - |
| 0.3341 | 2625 | 0.1065 | - |
| 0.3373 | 2650 | 0.0957 | - |
| 0.3405 | 2675 | 0.105 | - |
| 0.3436 | 2700 | 0.0964 | - |
| 0.3468 | 2725 | 0.0795 | - |
| 0.3500 | 2750 | 0.0774 | - |
| 0.3532 | 2775 | 0.1007 | - |
| 0.3564 | 2800 | 0.0864 | - |
| 0.3596 | 2825 | 0.1197 | - |
| 0.3627 | 2850 | 0.0979 | - |
| 0.3659 | 2875 | 0.0986 | - |
| 0.3691 | 2900 | 0.1103 | - |
| 0.3723 | 2925 | 0.1057 | - |
| 0.3755 | 2950 | 0.083 | - |
| 0.3786 | 2975 | 0.0908 | - |
| 0.3818 | 3000 | 0.0925 | 0.0871 |
| 0.3850 | 3025 | 0.0786 | - |
| 0.3882 | 3050 | 0.0866 | - |
| 0.3914 | 3075 | 0.1259 | - |
| 0.3946 | 3100 | 0.0998 | - |
| 0.3977 | 3125 | 0.083 | - |
| 0.4009 | 3150 | 0.0958 | - |
| 0.4041 | 3175 | 0.1113 | - |
| 0.4073 | 3200 | 0.0914 | - |
| 0.4105 | 3225 | 0.0914 | - |
| 0.4136 | 3250 | 0.0793 | - |
| 0.4168 | 3275 | 0.086 | - |
| 0.4200 | 3300 | 0.0666 | - |
| 0.4232 | 3325 | 0.1149 | - |
| 0.4264 | 3350 | 0.0658 | - |
| 0.4296 | 3375 | 0.1091 | - |
| 0.4327 | 3400 | 0.1014 | - |
| 0.4359 | 3425 | 0.0924 | - |
| 0.4391 | 3450 | 0.0918 | - |
| 0.4423 | 3475 | 0.0875 | - |
| 0.4455 | 3500 | 0.1099 | - |
| 0.4486 | 3525 | 0.0763 | - |
| 0.4518 | 3550 | 0.0984 | - |
| 0.4550 | 3575 | 0.0899 | - |
| 0.4582 | 3600 | 0.0736 | - |
| 0.4614 | 3625 | 0.1012 | - |
| 0.4646 | 3650 | 0.0773 | - |
| 0.4677 | 3675 | 0.0884 | - |
| 0.4709 | 3700 | 0.0832 | - |
| 0.4741 | 3725 | 0.0849 | - |
| 0.4773 | 3750 | 0.1067 | - |
| 0.4805 | 3775 | 0.0813 | - |
| 0.4836 | 3800 | 0.1014 | - |
| 0.4868 | 3825 | 0.0992 | - |
| 0.4900 | 3850 | 0.1162 | - |
| 0.4932 | 3875 | 0.0877 | - |
| 0.4964 | 3900 | 0.0907 | - |
| 0.4996 | 3925 | 0.0901 | - |
| 0.5027 | 3950 | 0.0952 | - |
| 0.5059 | 3975 | 0.0677 | - |
| 0.5091 | 4000 | 0.0855 | 0.0790 |
| 0.5123 | 4025 | 0.0848 | - |
| 0.5155 | 4050 | 0.0779 | - |
| 0.5186 | 4075 | 0.0836 | - |
| 0.5218 | 4100 | 0.1029 | - |
| 0.5250 | 4125 | 0.1045 | - |
| 0.5282 | 4150 | 0.088 | - |
| 0.5314 | 4175 | 0.0942 | - |
| 0.5346 | 4200 | 0.0811 | - |
| 0.5377 | 4225 | 0.0709 | - |
| 0.5409 | 4250 | 0.0767 | - |
| 0.5441 | 4275 | 0.0784 | - |
| 0.5473 | 4300 | 0.085 | - |
| 0.5505 | 4325 | 0.0692 | - |
| 0.5536 | 4350 | 0.0571 | - |
| 0.5568 | 4375 | 0.0932 | - |
| 0.5600 | 4400 | 0.0877 | - |
| 0.5632 | 4425 | 0.0715 | - |
| 0.5664 | 4450 | 0.1024 | - |
| 0.5696 | 4475 | 0.0939 | - |
| 0.5727 | 4500 | 0.0869 | - |
| 0.5759 | 4525 | 0.0839 | - |
| 0.5791 | 4550 | 0.0836 | - |
| 0.5823 | 4575 | 0.0867 | - |
| 0.5855 | 4600 | 0.094 | - |
| 0.5886 | 4625 | 0.0831 | - |
| 0.5918 | 4650 | 0.0926 | - |
| 0.5950 | 4675 | 0.0962 | - |
| 0.5982 | 4700 | 0.0714 | - |
| 0.6014 | 4725 | 0.0882 | - |
| 0.6046 | 4750 | 0.0883 | - |
| 0.6077 | 4775 | 0.1079 | - |
| 0.6109 | 4800 | 0.0868 | - |
| 0.6141 | 4825 | 0.0844 | - |
| 0.6173 | 4850 | 0.0803 | - |
| 0.6205 | 4875 | 0.0889 | - |
| 0.6236 | 4900 | 0.0725 | - |
| 0.6268 | 4925 | 0.083 | - |
| 0.6300 | 4950 | 0.12 | - |
| 0.6332 | 4975 | 0.0978 | - |
| 0.6364 | 5000 | 0.1138 | 0.0741 |
| 0.6396 | 5025 | 0.0874 | - |
| 0.6427 | 5050 | 0.064 | - |
Framework Versions
- Python: 3.10.16
- Sentence Transformers: 5.1.1
- Transformers: 4.56.2
- PyTorch: 2.8.0+cu128
- Accelerate: 1.10.1
- Datasets: 4.1.1
- Tokenizers: 0.22.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
Model tree for gguichard/matching-rh-gooaq-peft
Base model
EuroBERT/EuroBERT-210m