SentenceTransformer based on EuroBERT/EuroBERT-210m

This is a sentence-transformers model finetuned from EuroBERT/EuroBERT-210m on the matching_rh_val5 dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: EuroBERT/EuroBERT-210m
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False, 'architecture': 'EuroBertModel'})
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("gguichard/matching-rh-gooaq-peft")
# Run inference
sentences = [
    '{"type": "opportunity", "opportunity_title": "PMO Raw Material Strategy", "opportunity_place": "", "opportunity_expertise_area": "industrie pharmaceutique", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "Au sein du CoE mRNA et dans le cadre de la qualification des nouvelles matières premières mRNA, la prestation consiste a supporter le responsable RM program dans l’établissement de la stratégie \\n-\\tGestion de projet\\n-\\tEtablissement de la roadmap \\n-\\tMise en place des indicateurs \\n-\\tPilotage des budgets\\nLIVRABLES\\nA définir : Roadmap RM Strategy & KPI\\nEcheance 15/01/2024", "opportunity_criteria": "Bonjour Monsieur Thevenet \\nJe ne sais pas si vous avez vu sur Fielglass l’appel d’offre SPTQ00030223\\nNous recherchons un profil type école de commerce , achat pour une mission de 6 mois a commencé le 1 juillet", "opportunity_extract": 1, "customer_code": ""}',
    '{"type": "candidate", "title": "CV envoyé par HelloWork. Contient des données personnelles : ne pas utiliser, diffuser, copier sans le consentement de son auteur.", "skills": "atg, tpr, dsc, fx, drx, clhp, cpg, ccm, ci, uv-visible, rmn, icp, ir, sm, hg, meb, charpy, ms, excel, word, powerpoint, sap, internet, linkedin, gc, hplc, ltip, hplc-uv, hplc-ms, gc-fid, hg, h2/o2, tpr, meb\\n\\npréparation d’échantillons, extraction, métrologie, validation de méthodes, analyses mécaniques", "experience": "6", "education": "Bac3", "experiences": "[{\'skills\': \'\', \'startMonth\': \'\', \'endDate\': \'\', \'startYear\': \'\', \'description\': \'•\\\\nASCOTEC (fabrication d’additifs anti-corrosion) - Saint-Étienne (42) ; stage de fin d’études\', \'company\': \'ASCOTEC\', \'location\': \'Saint-Étienne\', \'id\': \'32227\', \'title\': \'stage de fin d’études\', \'endMonth\': \'\', \'endYear\': \'\', \'startDate\': \'\'}, {\'skills\': \'meb\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2015\', \'description\': \'•\\\\n: JTEKT - Irigny (69) : technicien de laboratoire : contrôles traitements thermiques, essais de validation pour la mise en\\\\nproduction de nouveaux projets, gestion d’une partie de la production de l’entreprise, tests de dureté, examens métallurgique s,\\\\nMEB, pollution.\', \'company\': \'JTEKT\', \'location\': \'\', \'id\': \'32228\', \'title\': \'technicien de laboratoire\', \'endMonth\': \'12\', \'endYear\': \'2015\', \'startDate\': \'\'}, {\'skills\': \'\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2016\', \'description\': \'•\\\\n- : ADHEX TECHNOLOGIES (fabrication d’adhésifs) - Chenôve (21) en alternance : étude des durées de vie des\\\\nproduits chimiques utilisés dans la formulation d’adhésifs, optimisation de leurs péremptions, mise en place d’un appareil de\\\\ndéchirement (réception, création d’une procédure de vérification et d’utilisation de l’appareil), tests physico-chimiques\', \'company\': \'ADHEX TECHNOLOGIES\', \'location\': \'\', \'id\': \'32229\', \'title\': \'\', \'endMonth\': \'1\', \'endYear\': \'2017\', \'startDate\': \'\'}, {\'skills\': \'hg, h2/o2, tpr\', \'startMonth\': \'11\', \'endDate\': \'\', \'startYear\': \'2017\', \'description\': \'•\\\\n- : IFPEN – Solaize (69) ; technicien en caractérisation texturale de matériaux\\\\ncatalytiques : physisorption azote et krypton, porosimétrie Hg, chimisorption H2/O2, TPR, granulométrie laser, essais\\\\nmécaniques\', \'company\': \'IFPEN\', \'location\': \'Solaize\', \'id\': \'32230\', \'title\': \'technicien en caractérisation\', \'endMonth\': \'12\', \'endYear\': \'2018\', \'startDate\': \'\'}, {\'skills\': \'hplc-uv, hplc-ms, gc-fid\', \'startMonth\': \'4\', \'endDate\': \'\', \'startYear\': \'2019\', \'description\': \'•\\\\n- : NOVASEP – Chasse-sur-Rhône (69) ; analyste\\\\nR&D : analyses sur HPLC-UV, HPLC-MS, GC-FID, développement de méthodes d’analyses\', \'company\': \'NOVASEP\', \'location\': \'Chasse-sur-Rhône\', \'id\': \'32231\', \'title\': \'analyste\', \'endMonth\': \'12\', \'endYear\': \'2019\', \'startDate\': \'\'}, {\'skills\': \'\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2020\', \'description\': \'•\\\\n– : JTEKT - Irigny (69) : technicien de\\\\nlaboratoire : dureté, microstructures, développement de méthodes\\\\nd’analyses\', \'company\': \'JTEKT\', \'location\': \'\', \'id\': \'32232\', \'title\': \'technicien de laboratoire\', \'endMonth\': \'6\', \'endYear\': \'2021\', \'startDate\': \'\'}, {\'skills\': \'hplc, ltip\', \'startMonth\': \'2\', \'endDate\': \'\', \'startYear\': \'2022\', \'description\': \'•\\\\n– : SANOFI Gerland : technicien CQ : analyses\\\\nprotéines par HPLC, LTIP\', \'company\': \'SANOFI Gerland\', \'location\': \'\', \'id\': \'32233\', \'title\': \'technicien CQ\', \'endMonth\': \'3\', \'endYear\': \'2022\', \'startDate\': \'\'}, {\'skills\': \'gc\', \'startMonth\': \'8\', \'endDate\': \'\', \'startYear\': \'2022\', \'description\': \'•\\\\n– : EXPLORAIR – Chasse-sur-Rhône (38) :\\\\ntechnicien site : prélèvements sur sites biométhane, analyses par GC\', \'company\': \'EXPLORAIR\', \'location\': \'Chasse-sur-Rhône\', \'id\': \'32234\', \'title\': \'technicien site\', \'endMonth\': \'12\', \'endYear\': \'2022\', \'startDate\': \'\'}]", "tools": "", "languages": "english,español", "mobility": "", "expertise_area": "industrie pharmaceutique,industrie chimique,industrie automobile,petrolegazeau", "activity_area": "chimie,caracterisationformulation,rd", "list_diplomes": "2017 - Licence professionnelle techniques analytiques - IUT de Lyon 1,2014 - DUT chimie option matériaux - IUT,2012 - Prépa concours manipulateur radio - Poly,2011 - Baccalauréat Scientifique option physique-chimie - lycée Sainte-Marie la Grand’Grange", "typeOf": "-1", "source": "-1", "informationComments": "", "extract": 1}',
    '{"type": "candidate", "title": "Ingénieure Qualité", "skills": "aisance relationnelle, capacité de calme, capacité de remise en question, capacité de résilience, complimente, créative, exigeante, flexible, honnête, méthodique, polie, réfléchie, sens de l’écoute, valorise\\n\\n21g, 5m, 5s, adobe acrobat, adr, aic, amadeo, amdec, amdec produit, aqf, bbs, bpc, bpf, calendar, canva, capa, ccmx, charte open space, cornerstone, dd, disc, dmaic, docusign, drive, dropbox, en9100, flash, ftp, gantt project, ged, gerep, google sheet, haccp, hse, im8000, iso, iso13485, iso14001, kpi, linkedin learning, nc, odoo, office13, office2013, office2021, office365, onedrive, pdf reader, photoshop, podcasts, power bi, ppap, prap, qc, qqoqcp, qse, qualitysaas, r&r, règlement dm, sap, sharepoint, silog, teams, tests r&r, visio, wrike, zip, zoom, 21g, 5s, amdec, aqf, bpf, capa, charte open space, en9100, ged, im8000, iso13485, kpi, office13, ppap, qc, qse, r&r, sap, tests r&r, adr, bbs, dd, haccp, iso14001, prap, 5s\\n\\naccompagnement des parties intéressées, analyse des processus, animer des 8d internes, former 1 ouvrière, assurer le suivi des plans d’actions correctives et d’amélioration, audit de poste, auditer les dossiers de lots concernant les bpd, code de l’environnement, communication interne externe, définir des indicateurs de qualité, nc, bpc les piloter et en assurer le suivi, elaborer 1 tcd hebdo, reporting pour suivi audits et reporting sprint meeting, elaborer des indicateurs de suivi de la qualité, elaborer des outils qualité, gestion de budget, contrat, gestion de crise, gestion des tests laboratoires, gérer 250 réclamations clients des produits semi finis dm classiia classiib classiii, gérer des projets qualité intégralement, gérer la base documentaire, gérer les tests brouillards salins, gérer les échantillons initiaux, lecture de plans industriels, qc, test, 8d, manager la référente qualité des 4 usines internationales, manager une équipe de 8 contrôleuses qualité, mener la veille règlementaire, mener les revues de direction, mener l’ensemble des plans d’actions de l’arrêté préfectoral, mettre à jour 3 documents uniques, et mener les plans d’actions, mise en place de formation, mise à jour d’1 analyse environnementale, optimisation de service, optimiser le service de contrôle qualité de sous-traitance -70% de qc, optimiser le service métrologie, organiser mes formations suivant le programme cornerstone, communication anglais par teams, organiser, planifier et mettre en œuvre des audits, outils de communication et management, participer au lancement des nouveaux produits en validant la conformité, piloter et animer cinquante 8d et les traduire, planifier, suivre et progresser le projet, pratiquer des outils de management, production lean, proposer des axes d’amélioration continue, qualification et évaluation de 25 fournisseurs et 1 audit, rechercher et mener les actions de la veille réglementaire, réaliser 1 cotation des aspects et impacts environnementaux, réaliser 1 indicateur type tcd des non-conformité, réaliser le support de formation, rédiger 10 dossiers techniques, rédiger les politiques qualité, se, manuel qualité, sourcing, sourcing lean, suivi d’audit, techniques audits internes, utiliser des outils de communication interne, vérifier 10 dossiers de lots par jour des dm classiib", "experience": "-1", "education": "", "experiences": "[{\'skills\': \'5s\', \'startMonth\': \'2\', \'endDate\': \'\', \'startYear\': \'2005\', \'description\': \'Chargé Amélioration continue\\\\n5 - 0 : ARMAPEX - APEX - TTI (Expatriée Vietnam)\\\\n5 - 0 : ARMAPEX - APEX - TTI (Expatriée Vietnam)\\\\n- : ARMAPEX - APEX - TTI (Expatriée Vietnam)\\\\nPiloter les 5S (3 usines en 5S)\\\\nRédiger 10 dossiers techniques (Textile)\\\\nDéfinir des indicateurs de qualité, NC, BPC les piloter et en assurer le suivi (ST : LVMH Lancel)\\\\nAssurer le suivi des plans d’actions correctives et d’amélioration\\\\nParticiper au lancement des nouveaux produits en validant la conformité\\\\nManager une équipe de 8 contrôleuses qualité\', \'company\': \'ARMAPEX\', \'location\': \'\', \'id\': \'34635\', \'title\': \'Chargé Amélioration continue\', \'endMonth\': \'2\', \'endYear\': \'2010\', \'startDate\': \'\'}, {\'skills\': \'adr, bbs, dd, haccp, iso14001, prap\', \'startMonth\': \'10\', \'endDate\': \'\', \'startYear\': \'2010\', \'description\': \\"ROSSETTO CDD (1 an) : Responsable Qualité\\\\nMise en œuvre de l’ISO9001 sur un site novice en toute autonomie\\\\nManager une équipe de 5 personnes\\\\nManager la référente qualité des 4 usines internationales\\\\nRépondre à l\'audit client : +30% de conformité obtenue\\\\nOI MANUFACTURING (1an) GROUPE : Ingénieur Environnement\\\\nMise à jour d’1 analyse environnementale\\\\nRéaliser 1 cotation des aspects et impacts environnementaux, DIB, DD...\\\\nMener l’ensemble des plans d’actions de l’arrêté préfectoral ICPEA\\\\nPlanifier, suivre et progresser le projet de l’ISO14001\\\\nRechercher et mener les actions de la veille réglementaire, AMADEO\\\\nZIEGLER (2ans) GROUPE: Animatrice QHSE\\\\nRédiger les politiques Qualité, SE, Manuel Qualité\\\\nMener les revues de direction\\\\nGérer 5000 documents ISO9001\\\\nRéaliser le support de formation à l’ADR, BBS, HACCP, PRAP\\\\nCertifications ISO 9001, SQAS 6 agences certifiées\\\\nMettre à jour 3 documents uniques, et mener les plans d’actions\\\\nCoordinateur QHSE\\\\n0 - 6 : ZIEGLER - OI MANUFACTURING - ROSSETTO\\\\n0 - 6 : ZIEGLER - OI MANUFACTURING - ROSSETTO\\\\n- : ZIEGLER - OI MANUFACTURING - ROSSETTO\\", \'company\': \'ZIEGLER\', \'location\': \'ROSSETTO\', \'id\': \'34636\', \'title\': \'OI MANUFACTURING\', \'endMonth\': \'11\', \'endYear\': \'2016\', \'startDate\': \'\'}, {\'skills\': \'21g, 5s, amdec, aqf, bpf, capa, charte open space, en9100, ged, im8000, iso13485, kpi, office13, ppap, qc, qse, r&r, sap, tests r&r\', \'startMonth\': \'1\', \'endDate\': \'\', \'startYear\': \'2017\', \'description\': \'Limatech Start-Up (7,5mois) CDI :\\\\nResponsable Qualité :\\\\nSuivi des CAPA pour le renouvellement de certifications part21G, EN9100.\\\\nElaborer 1 TCD hebdo, reporting pour suivi audits et reporting sprint meeting.\\\\nQualification et évaluation de 25 fournisseurs et 1 audit EN9100.\\\\nMise en place de formation IM8000, pour backup sécurisation du QC, charte open space.\\\\nChargée Qualité : AQF +QSE +5S +Métrologie +GED +Contrats Prestataires +Achats\\\\nSupport direct à la direction : outils de communication et management\\\\nMEDTRONIC PME (11mois) CDD :\\\\n+40% du site formé à l’ISO13485, au règlement 2017/745, aux BPF, Politique Groupe\\\\nAuditer les dossiers de lots concernant les BPD, audit de poste, tests R&R, contrat, sourcing\\\\nAugmentation du KPI : 95 % de conformité sur la partie formation, échanger en anglais avec teams\\\\nOrganiser mes formations suivant le programme Cornerstone, communication anglais par teams\\\\nOptimiser le service Métrologie, -40% d’activité, réaliser le 5S, Vérifier les 900 équipements\\\\nRédiger 1 plan de transition sur 4 semaines avec 100 tâches et former au poste du remplaçant\\\\nARAYMOND PME (9 mois) CDD :\\\\nOptimiser le service de contrôle qualité de sous-traitance -70% de QC\\\\nVérifier 50 dossiers PPAP des sous traitants (AMDEC, R&R, Test...) IATF\\\\nGérer les tests brouillards salins, gérer les échantillons initiaux\\\\nRéaliser 1 indicateur type TCD des non-conformité\\\\nAnimer des 8D internes, former 1 ouvrière à Office13, SAP, Lecture de plans industriels, QC, test, 8D\\\\nMINITUBES PME CDI - DENTSPLY PME CDD : (2,5 ans)\\\\nGérer 250 réclamations clients des produits Semi finis DM ClassIIa ClassIIb classIII\\\\nVérifier 10 dossiers de lots par jour des DM classIIb\\\\nPiloter et animer cinquante 8D et les traduire en anglais\\\\nAnimer 750 réunions de suivi de CAPA en 2 ans et 5 conf call clients USA en anglais\\\\nRépondre à 1 audit ISO13485 partie satisfaction clients\\\\nCoordinateur Qualité\\\\n7 - 4 : MINITUBES - DENTSPLY - ARAYMOND - MEDTRONIC\\\\n7 - 4 : MINITUBES - DENTSPLY - ARAYMOND - MEDTRONIC\\\\n- : MINITUBES - DENTSPLY - ARAYMOND - MEDTRONIC\', \'company\': \'MINITUBES\', \'location\': \'\', \'id\': \'34637\', \'title\': \'Coordinateur Qualité\', \'endMonth\': \'7\', \'endYear\': \'2024\', \'startDate\': \'\'}]", "tools": "", "languages": "anglais,français,vietnamien", "mobility": "", "expertise_area": "", "activity_area": "", "list_diplomes": "2024 - Certification Yellow Belt Lean Management BAC+4/5 - XLGROUP,2020 - Certification management d\'équipe BAC+4/5,2014 - Licence Coordinateur qualité système BAC+3 - IUT MONTPELLIER II,2014 - Licence gestion industrielle BAC+3 - IUT NIMES,2010 - Certification RNCP Animateur QSE BAC+2 - CESI STRASBOURG", "typeOf": "-1", "source": "0", "informationComments": "", "extract": 1}',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 0.1407, 0.0456],
#         [0.1407, 1.0000, 0.3780],
#         [0.0456, 0.3780, 1.0000]])

Training Details

Training Dataset

matching_rh_val5

  • Dataset: matching_rh_val5 at 81797ca
  • Size: 62,850 training samples
  • Columns: label, sentence1, and sentence2
  • Approximate statistics based on the first 1000 samples:
    label sentence1 sentence2
    type float string string
    details
    • min: 0.0
    • mean: 0.22
    • max: 1.0
    • min: 82 tokens
    • mean: 297.31 tokens
    • max: 1664 tokens
    • min: 85 tokens
    • mean: 1005.62 tokens
    • max: 4853 tokens
  • Samples:
    label sentence1 sentence2
    1.0 {"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""} {"type": "candidate", "title": "Senior Consultant/Project Manager - Data Management", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Avril ❖Mission : * Automatisation et fiabilisation des calculs de l'inventaire de réassurance sur les produits de prévoyance individuelle commercialisés par les partenaires d'Axa France (SAS/SQL) * Etude de l'efficience et de la rentabilité des traités de réassurance mis en place pour sécuriser le portefeuille de ces produits (SAS/C++). laureline@itconsultants.fr 8 Laure-Line Gautun 06 03 68 52 31 WWW.ITCONSULTANTS.FR ❖ Réalisations : * Etudes techniques : - Réalisation d'un cahier des charges listant les données nécessaires pour les calculs de l'inventaire et de la rentabilité des traités de réassurance - Validation des spécifications fonctionnelles de la MOA et recette métier - Automatisation des calculs et des contrôles sur les comptes d'inventaire de...
    0.0 {"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""} {"type": "candidate", "title": "CHEF DE PROJETS", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': 'ADMINISTRATION ET OPTIMISATION DES PERFORMANCES DES BASES DE DONNÉES (ORACLE ET SQLSERVER) DE PROD ET PREPROD FORMÉS DE PLUS DE 450 SERVEURS (WIN2K3, SOLARIS, AIX.) POUR LES DEUX CLIENTS GEFCO ET CANAL PLUS', 'company': '', 'location': '', 'id': '1913', 'title': 'INGENIEUR DBA - ATOS ORIGIN - 01/01/2009 - 01/01/2011', 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "CONSEIL Les eaux minérales d'oulmes - pILOTAGE PROJET PILOTAGE DES PROJETS INFORMATIQUES : SUIVI BUDGÉTAIRE, PLANIFICATION, GESTION DES ÉQUIPES GESTION DES APPELS D'OFFRE ET LES RELATIONS AVEC LES PRESTATAIRES.", 'company': '', 'location': '', 'id': '1914', 'title': 'SCRUM MASTER, PRODUCT OWNER - PILOTAGE DES PROJETS INFORMATIQUES - 01/01/2016 - 0...
    0.0 {"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""} {"type": "candidate", "title": "ANALYSTE MAINFRAME", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Maitrise d'œuvre : mission de maintenance corrective et évolutive de l'application informatique ETC - gestion des contrats télématiques entreprises * Analyse des spécifications fonctionnelles * Etudes techniques, études d'impact, chiffrage * Rédaction des spécifications techniques détaillées * Développement, tests unitaires et d'intégration * Rédaction des livrables : dossiers de tests, dossiers d'exploitation * Suivi de production, résolution d'incidents, assistance à utilisateur Environnement technique : MVS, TSO, COBOL, JCL, DB2, DL1, IMS, ENDEVOR", 'company': '', 'location': '', 'id': '1907', 'title': "Ingénieur d'études - Prestation BNP Paribas - 01/01/2009 - 01/01/2012", 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear'...
  • Loss: CosineSimilarityLoss with these parameters:
    {
        "loss_fct": "torch.nn.modules.loss.MSELoss"
    }
    

Evaluation Dataset

matching_rh_val5

  • Dataset: matching_rh_val5 at 81797ca
  • Size: 62,850 evaluation samples
  • Columns: label, sentence1, and sentence2
  • Approximate statistics based on the first 1000 samples:
    label sentence1 sentence2
    type float string string
    details
    • min: 0.0
    • mean: 0.22
    • max: 1.0
    • min: 82 tokens
    • mean: 297.31 tokens
    • max: 1664 tokens
    • min: 85 tokens
    • mean: 1005.62 tokens
    • max: 4853 tokens
  • Samples:
    label sentence1 sentence2
    1.0 {"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""} {"type": "candidate", "title": "Senior Consultant/Project Manager - Data Management", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Avril ❖Mission : * Automatisation et fiabilisation des calculs de l'inventaire de réassurance sur les produits de prévoyance individuelle commercialisés par les partenaires d'Axa France (SAS/SQL) * Etude de l'efficience et de la rentabilité des traités de réassurance mis en place pour sécuriser le portefeuille de ces produits (SAS/C++). laureline@itconsultants.fr 8 Laure-Line Gautun 06 03 68 52 31 WWW.ITCONSULTANTS.FR ❖ Réalisations : * Etudes techniques : - Réalisation d'un cahier des charges listant les données nécessaires pour les calculs de l'inventaire et de la rentabilité des traités de réassurance - Validation des spécifications fonctionnelles de la MOA et recette métier - Automatisation des calculs et des contrôles sur les comptes d'inventaire de...
    0.0 {"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""} {"type": "candidate", "title": "CHEF DE PROJETS", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': 'ADMINISTRATION ET OPTIMISATION DES PERFORMANCES DES BASES DE DONNÉES (ORACLE ET SQLSERVER) DE PROD ET PREPROD FORMÉS DE PLUS DE 450 SERVEURS (WIN2K3, SOLARIS, AIX.) POUR LES DEUX CLIENTS GEFCO ET CANAL PLUS', 'company': '', 'location': '', 'id': '1913', 'title': 'INGENIEUR DBA - ATOS ORIGIN - 01/01/2009 - 01/01/2011', 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "CONSEIL Les eaux minérales d'oulmes - pILOTAGE PROJET PILOTAGE DES PROJETS INFORMATIQUES : SUIVI BUDGÉTAIRE, PLANIFICATION, GESTION DES ÉQUIPES GESTION DES APPELS D'OFFRE ET LES RELATIONS AVEC LES PRESTATAIRES.", 'company': '', 'location': '', 'id': '1914', 'title': 'SCRUM MASTER, PRODUCT OWNER - PILOTAGE DES PROJETS INFORMATIQUES - 01/01/2016 - 0...
    0.0 {"type": "opportunity", "opportunity_title": "DATA MANAGER - La POSTE", "opportunity_place": "", "opportunity_expertise_area": "Services", "opportunity_tools": "", "opportunity_activity_area": "", "opportunity_type": "t1", "opportunity_description": "", "opportunity_criteria": "", "opportunity_extract": 1, "customer_code": ""} {"type": "candidate", "title": "ANALYSTE MAINFRAME", "skills": "", "experience": "-1", "education": "", "experiences": "[{'skills': '', 'startMonth': '', 'endDate': '', 'startYear': '', 'description': "Maitrise d'œuvre : mission de maintenance corrective et évolutive de l'application informatique ETC - gestion des contrats télématiques entreprises * Analyse des spécifications fonctionnelles * Etudes techniques, études d'impact, chiffrage * Rédaction des spécifications techniques détaillées * Développement, tests unitaires et d'intégration * Rédaction des livrables : dossiers de tests, dossiers d'exploitation * Suivi de production, résolution d'incidents, assistance à utilisateur Environnement technique : MVS, TSO, COBOL, JCL, DB2, DL1, IMS, ENDEVOR", 'company': '', 'location': '', 'id': '1907', 'title': "Ingénieur d'études - Prestation BNP Paribas - 01/01/2009 - 01/01/2012", 'endMonth': '', 'endYear': '', 'startDate': ''}, {'skills': '', 'startMonth': '', 'endDate': '', 'startYear'...
  • Loss: CosineSimilarityLoss with these parameters:
    {
        "loss_fct": "torch.nn.modules.loss.MSELoss"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • learning_rate: 2e-05
  • num_train_epochs: 1
  • warmup_ratio: 0.1
  • bf16: True

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 8
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Click to expand
Epoch Step Training Loss Validation Loss
0.0001 1 0.3954 -
0.0032 25 0.3749 -
0.0064 50 0.3615 -
0.0095 75 0.2741 -
0.0127 100 0.218 -
0.0159 125 0.2086 -
0.0191 150 0.1582 -
0.0223 175 0.1871 -
0.0255 200 0.1709 -
0.0286 225 0.1296 -
0.0318 250 0.1723 -
0.0350 275 0.1139 -
0.0382 300 0.1458 -
0.0414 325 0.1677 -
0.0445 350 0.1644 -
0.0477 375 0.1359 -
0.0509 400 0.1168 -
0.0541 425 0.184 -
0.0573 450 0.139 -
0.0605 475 0.1702 -
0.0636 500 0.1255 -
0.0668 525 0.1227 -
0.0700 550 0.1454 -
0.0732 575 0.1411 -
0.0764 600 0.1208 -
0.0795 625 0.1262 -
0.0827 650 0.1042 -
0.0859 675 0.1367 -
0.0891 700 0.142 -
0.0923 725 0.1295 -
0.0955 750 0.1326 -
0.0986 775 0.1237 -
0.1018 800 0.1316 -
0.1050 825 0.1289 -
0.1082 850 0.1357 -
0.1114 875 0.1107 -
0.1145 900 0.1098 -
0.1177 925 0.1079 -
0.1209 950 0.1003 -
0.1241 975 0.0961 -
0.1273 1000 0.1198 0.1112
0.1305 1025 0.1322 -
0.1336 1050 0.1176 -
0.1368 1075 0.1329 -
0.1400 1100 0.1038 -
0.1432 1125 0.1118 -
0.1464 1150 0.1131 -
0.1495 1175 0.1052 -
0.1527 1200 0.1149 -
0.1559 1225 0.12 -
0.1591 1250 0.1026 -
0.1623 1275 0.134 -
0.1655 1300 0.1213 -
0.1686 1325 0.1069 -
0.1718 1350 0.1108 -
0.1750 1375 0.1318 -
0.1782 1400 0.1159 -
0.1814 1425 0.0815 -
0.1845 1450 0.1155 -
0.1877 1475 0.1148 -
0.1909 1500 0.1036 -
0.1941 1525 0.1033 -
0.1973 1550 0.0707 -
0.2005 1575 0.1171 -
0.2036 1600 0.1181 -
0.2068 1625 0.1126 -
0.2100 1650 0.0714 -
0.2132 1675 0.1124 -
0.2164 1700 0.104 -
0.2195 1725 0.1035 -
0.2227 1750 0.1149 -
0.2259 1775 0.089 -
0.2291 1800 0.1206 -
0.2323 1825 0.1079 -
0.2355 1850 0.0865 -
0.2386 1875 0.1134 -
0.2418 1900 0.1151 -
0.2450 1925 0.0779 -
0.2482 1950 0.1002 -
0.2514 1975 0.1151 -
0.2546 2000 0.1104 0.0939
0.2577 2025 0.1 -
0.2609 2050 0.1214 -
0.2641 2075 0.095 -
0.2673 2100 0.0876 -
0.2705 2125 0.094 -
0.2736 2150 0.1177 -
0.2768 2175 0.086 -
0.2800 2200 0.0806 -
0.2832 2225 0.1003 -
0.2864 2250 0.0876 -
0.2896 2275 0.1012 -
0.2927 2300 0.0809 -
0.2959 2325 0.0913 -
0.2991 2350 0.0935 -
0.3023 2375 0.0876 -
0.3055 2400 0.0712 -
0.3086 2425 0.085 -
0.3118 2450 0.0965 -
0.3150 2475 0.0962 -
0.3182 2500 0.0931 -
0.3214 2525 0.1121 -
0.3246 2550 0.0881 -
0.3277 2575 0.096 -
0.3309 2600 0.0893 -
0.3341 2625 0.1065 -
0.3373 2650 0.0957 -
0.3405 2675 0.105 -
0.3436 2700 0.0964 -
0.3468 2725 0.0795 -
0.3500 2750 0.0774 -
0.3532 2775 0.1007 -
0.3564 2800 0.0864 -
0.3596 2825 0.1197 -
0.3627 2850 0.0979 -
0.3659 2875 0.0986 -
0.3691 2900 0.1103 -
0.3723 2925 0.1057 -
0.3755 2950 0.083 -
0.3786 2975 0.0908 -
0.3818 3000 0.0925 0.0871
0.3850 3025 0.0786 -
0.3882 3050 0.0866 -
0.3914 3075 0.1259 -
0.3946 3100 0.0998 -
0.3977 3125 0.083 -
0.4009 3150 0.0958 -
0.4041 3175 0.1113 -
0.4073 3200 0.0914 -
0.4105 3225 0.0914 -
0.4136 3250 0.0793 -
0.4168 3275 0.086 -
0.4200 3300 0.0666 -
0.4232 3325 0.1149 -
0.4264 3350 0.0658 -
0.4296 3375 0.1091 -
0.4327 3400 0.1014 -
0.4359 3425 0.0924 -
0.4391 3450 0.0918 -
0.4423 3475 0.0875 -
0.4455 3500 0.1099 -
0.4486 3525 0.0763 -
0.4518 3550 0.0984 -
0.4550 3575 0.0899 -
0.4582 3600 0.0736 -
0.4614 3625 0.1012 -
0.4646 3650 0.0773 -
0.4677 3675 0.0884 -
0.4709 3700 0.0832 -
0.4741 3725 0.0849 -
0.4773 3750 0.1067 -
0.4805 3775 0.0813 -
0.4836 3800 0.1014 -
0.4868 3825 0.0992 -
0.4900 3850 0.1162 -
0.4932 3875 0.0877 -
0.4964 3900 0.0907 -
0.4996 3925 0.0901 -
0.5027 3950 0.0952 -
0.5059 3975 0.0677 -
0.5091 4000 0.0855 0.0790
0.5123 4025 0.0848 -
0.5155 4050 0.0779 -
0.5186 4075 0.0836 -
0.5218 4100 0.1029 -
0.5250 4125 0.1045 -
0.5282 4150 0.088 -
0.5314 4175 0.0942 -
0.5346 4200 0.0811 -
0.5377 4225 0.0709 -
0.5409 4250 0.0767 -
0.5441 4275 0.0784 -
0.5473 4300 0.085 -
0.5505 4325 0.0692 -
0.5536 4350 0.0571 -
0.5568 4375 0.0932 -
0.5600 4400 0.0877 -
0.5632 4425 0.0715 -
0.5664 4450 0.1024 -
0.5696 4475 0.0939 -
0.5727 4500 0.0869 -
0.5759 4525 0.0839 -
0.5791 4550 0.0836 -
0.5823 4575 0.0867 -
0.5855 4600 0.094 -
0.5886 4625 0.0831 -
0.5918 4650 0.0926 -
0.5950 4675 0.0962 -
0.5982 4700 0.0714 -
0.6014 4725 0.0882 -
0.6046 4750 0.0883 -
0.6077 4775 0.1079 -
0.6109 4800 0.0868 -
0.6141 4825 0.0844 -
0.6173 4850 0.0803 -
0.6205 4875 0.0889 -
0.6236 4900 0.0725 -
0.6268 4925 0.083 -
0.6300 4950 0.12 -
0.6332 4975 0.0978 -
0.6364 5000 0.1138 0.0741
0.6396 5025 0.0874 -
0.6427 5050 0.064 -

Framework Versions

  • Python: 3.10.16
  • Sentence Transformers: 5.1.1
  • Transformers: 4.56.2
  • PyTorch: 2.8.0+cu128
  • Accelerate: 1.10.1
  • Datasets: 4.1.1
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for gguichard/matching-rh-gooaq-peft

Finetuned
(45)
this model