gpellejero commited on
Commit
81fd86e
·
verified ·
1 Parent(s): 00a9ec0

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
37
+ unigram.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 384,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,780 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:3726
8
+ - loss:TripletLoss
9
+ base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
10
+ widget:
11
+ - source_sentence: ¿Hay guías turísticos disponibles en Monte Santiago?
12
+ sentences:
13
+ - "Título: Embalse del Ebro\nZona: Merindades\nDuración: \nCoordenadas: \nTipo de\
14
+ \ recurso: Rutas-De pajareo\n\nEmbalse del Ebro\n\nEl embalse del Ebro es uno\
15
+ \ de los humedales más importantes para aves acuáticas de Castilla y León. Con\
16
+ \ 6.250 hectáreas de superficie y hasta 20 km. de longitud. Es un embalse de orillas\
17
+ \ abiertas y escasa profundidad.En su perímetro apareceuna ligera banda de vegetación\
18
+ \ acuática y algunos bosquetes de vegetación leñosa de ribera.Desde 1987 es Refugio\
19
+ \ Nacional de Aves Acuáticas. Distintas especies , muchas de ellas singulares,\
20
+ \ han encontrado aquí el lugar ideal para pasar sus estíos y recuperarse de sus\
21
+ \ largas migraciones.Esta ruta incluye casi toda la zona burgalesa del embalse\
22
+ \ y su entorno, entre pastizales, turberas, zonas de matorral y algún bosque bien\
23
+ \ desarrollado (robles, hayas, pinos).LAS AVESResidentesZampullín chico - Zampullín\
24
+ \ cullinegro - Somormujo lavanco - Ánade real - Ánade friso - Aguilucho pálido\
25
+ \ - Azor común - Rascón europeo – Polla de agua – Focha común – Gaviota patiamarilla\
26
+ \ – Búho chico – Martín pescador – Pito real.De PasoEspátula – Ansar común – Cerceta\
27
+ \ carretona – Aguilucho lagunero – Águila pescadora – Correlimos común – Pechiazul.EstivalesAvetorillo\
28
+ \ común – Cigüeña blanca – Culebrera europea – Aguilucho cenizo – Milano negro\
29
+ \ – Halcón abejero – Chorlitejo chico – Andarríos chico – Avión zapador – Bisbita\
30
+ \ campestre – Bisbita arbóreo – Lavandera boyera – Tarabilla norteña – Collalba\
31
+ \ gris – Carricero tordal – Alcaudón dorsirrojo – Alcaudón común.InvernantesCormorán\
32
+ \ grande – Ánade rabudo – Ánade silbón – Pato colorado – Porrón común – Porrón\
33
+ \ moñudo – Avefría europea – Agachadiza común – Gaviota reidora.ÉPOCA RECOMENDADAPrimaveraNidificación\
34
+ \ de diversas anátidas, fochas y somormujos. Época de paso de limícolas. Destaca\
35
+ \ la presencia reproductora de Avetorillo Común, Cigüeña Común, Halcón Abejero,\
36
+ \ Milano Negro, Águila culebrera, Martín Pescador y Chova Piquirroja. Otras especies\
37
+ \ reproductoras son el Chotacabras Gris, la Bisbita Campestre y el Estornino Pinto,\
38
+ \ esta última con poblaciones nidificantes muy escasas a nivel regional. Existen\
39
+ \ varias colonias de Avión Zapador.VeranoSigue la nidificación de algunas especies,\
40
+ \ podemos contemplar concentraciones de Cigüeñas blancas entre pastizales, algunas\
41
+ \ especies inician la migración.OtoñoPaso de Espátulas y otras limícolas y anátidas\
42
+ \ que aprovechan la zona para reponer fuerzas y continuar el largo viaje migratorio.InviernoDiversas\
43
+ \ especies de anátidas y algunas limícolas invernan en el embalse."
44
+ - "Título: Btt Montes de la Peña\nZona: Merindades\nDuración: 12 h\nCoordenadas:\
45
+ \ 43.08362,-3.31481\nTipo de recurso: Rutas-Territorio Ciclista-BTT-eBike\n\n\
46
+ Btt Montes de la Peña\n\nComenzamos ruta en la localidad de Villasuso de Mena.Partimos\
47
+ \ tranquilos por un bonito sendero entre prados que nos lleva a las faldas de\
48
+ \ los montes de la Peña, donde enseguida afrontaremos un importante y largo ascenso\
49
+ \ con algunos tramos espectaculares de senda bajo un cerrado bosque de hayas.\
50
+ \ A pesar de tener tramos de bastante pendiente, el buen terreno, su sinuoso recorrido,\
51
+ \ y la belleza del bosque, harán que disfrutemos de esta subida.Tras un rápido\
52
+ \ descenso por pistas y caminos anchos entre el bosque y las praderas, ascenderemos\
53
+ \ esta vez entre robles hacia el santuario de Cantonad, donde podremos hacer una\
54
+ \ breve parada y disfrutar de sus privilegiadas vistas del valle.Continuaremos\
55
+ \ ahora ascendiendo a la parte más alta del valle por un terreno más pistero,\
56
+ \ en busca de la pequeña localidad de Irús, donde comenzará uno de los tramos\
57
+ \ más especiales de la ruta, descendiendo por la antigua calzada El Camino Real\
58
+ \ de las Enderrozas, con espectaculares tramos de senda y calzada dentro de un\
59
+ \ silencioso bosque, en el que sólo escucharemos las aguas del río Hijuela al\
60
+ \ formar bellos saltos y cascadas.En la última parte del recorrido, alternaremos\
61
+ \ tramos de pequeñas subidas y bajadas, por caminos más abiertos a zonas de pradera,\
62
+ \ atravesando pequeños pueblos con encanto, y tras un pequeño descenso, por un\
63
+ \ sendero entre praderas llegaremos al punto de partida.\n\nZonas de especial\
64
+ \ atención-KM 5-6: Descenso con fuerte pendiente, curvas cerradas y pequeño tramo\
65
+ \ de travesía entre casas. Transitar con precaución.-KM 7,7: Desvío por pequeña\
66
+ \ pradera con senda poco marcada. Fijarse bien en el trazado del gps para no equivocarse\
67
+ \ de camino-KM 8,5-9: Pequeño tramo de ida y vuelta opcional para visitar el santuario\
68
+ \ de Cantonad.-KM 13-14: Descenso con fuerte pendiente por pista de gravilla y\
69
+ \ algo de rodera. Transitar con precaución.-KM 14-16: tramo de descenso por senda\
70
+ \ y calzada estrechas habitualmente frecuentada por senderistas. Transitar respetando\
71
+ \ al resto de usuarios.-KM 21,5: cruce de carretera general con tráfico intenso.\
72
+ \ Extremar precaución al pasar.\n\n\n\n\n\n\n\n btt-medio.jpg\n \n \
73
+ \ \n \n \n\n \n\n\n\n\n\n\n\n\n\n\n\n\n logotipo_lineaverde_merindades.png"
74
+ - "Título: Monte Santiago\nZona: Merindades\nDuración: \nCoordenadas: \nTipo de\
75
+ \ recurso: Rutas-De pajareo\n\nMonte Santiago\n\nEl Monumento Natural de Monte\
76
+ \ Santiago, es un conjunto natural único en España. Se encuentra situado al noroeste\
77
+ \ de la provincia de Burgos y al noroeste de la de Álava, entre la sierra Salvada\
78
+ \ o Gorobel y la de Gibijo. Su paisaje aparece dominado por un frondoso y bien\
79
+ \ conservado hayedo.Se puede acceder al espacio por el norte desde el puerto de\
80
+ \ Orduña y, partiendo de la cumbre, ir al mirador desde el que se contempla el\
81
+ \ Salto del Nervión y el cañón que forma el río del mismo nombre, o al monumento\
82
+ \ en honor a la Virgen de Orduña. Desde el sur se accede partiendo de Berberana.Borde\
83
+ \ de un anfiteatro rocoso, formado por cresterías calizas de la Sierra Salvada,\
84
+ \ en uno de sus más aislados y profundos recovecos se localiza el espectacular\
85
+ \ salto del Nervión. Con sus casi 300 metros de altura y su peculiar forma de\
86
+ \ cola de caballo conforma una de las cascadas más grandes y hermosas que se pueden\
87
+ \ contemplar en toda Europa occidental.El territorio en sus cotas más altas está\
88
+ \ encuadrado plenamente en el dominio biogeográfico atlántico, con el haya como\
89
+ \ especie más significativa y en las cotas medias y bajas de las laderas en una\
90
+ \ zona de transición atlántica y mediterránea.LAS AVESResidentesBuitre leonado\
91
+ \ – Águila real – Aguilucho pálido – Gavilán común – Azor común – Cernícalo común\
92
+ \ – Halcón peregrino – Paloma torcaz – Búho chico – Pito real – Pico picapinos\
93
+ \ – Pico menor – Alondra común – Acentor alpino – Herrerillo capuchino – Carbonero\
94
+ \ palustre – Trepador azul – Agateador común – Arrendajo – Grajilla – Chova piquirroja\
95
+ \ – Chova piquigüalda – Cuervo – Escribano.De pasoPapamoscas cerrojilloEstivalesAlimoche\
96
+ \ – Culebrera europea – Aguililla calzada – Milano negro – Aguilucho cenizo –\
97
+ \ Abejero europeo – Alcotán – Tórtola común – Cuco común – Vencejo real – Torcecuello\
98
+ \ – Avión roquero – Bisbita campestre – Bisbita arbóreo – Colirrojo real – Tarabilla\
99
+ \ norteña – Collalba gris – Roquero rojo.InvernantesMilano real – Chocha perdiz\
100
+ \ – Treparriscos – Pinzón real.ÉPOCA RECOMENDADAPrimaveraEs el mejor momento para\
101
+ \ la observación de avifauna, interesante combinación de hábitats con rupícolas\
102
+ \ como buitres leonados, chovas, vencejos reales, etc. Con la combinación de bosques\
103
+ \ de haya, encina, quejigo y pinar, y los pastizales.VeranoSigue la nidificación\
104
+ \ de algunas especies, las forestales son más complicadas de ver. Vuelos primerizos\
105
+ \ de pollos. Algunas aves como los alimoches se pueden observar en pequeños grupos\
106
+ \ familiares.OtoñoPaso de aves migratorias camino del sur.InviernoEn esta época\
107
+ \ y en años buenos de hayucos, se pueden ver grandes bandos de pinzones reales\
108
+ \ que buscan alimento en el hayedo. Se juntan por cientos en un lugar donde pasar\
109
+ \ la noche, siendo uno de esos grandes espectáculos que la naturaleza nos brinda."
110
+ - source_sentence: ¿Qué puntos de interés puedo encontrar en el PR-BU 101 Sendero
111
+ de Caminos de Oña?
112
+ sentences:
113
+ - "Título: BTT | Entre hayedos\nZona: Merindades\nDuración: 12 h\nCoordenadas: 42.9657743,-3.8720355\n\
114
+ Tipo de recurso: Rutas-Territorio Ciclista-BTT\n\nBTT | Entre hayedos\n\nPartiendo\
115
+ \ desde la pequeña localidad de Quintanilla San Román, comenzamos por un camino\
116
+ \ de doble rodadura sencillo que nos irá adentrando en el frondoso hayedo de Carrales,\
117
+ \ el cual nos dará cobijo durante 9 largos km de puro bosque.Tras un pequeño tramo\
118
+ \ por carretera, abandonamos el hayedo y nos adentramos en territorio cántabro\
119
+ \ durante unos km por un valle de campiña en el cual iremos ganando vistas a medida\
120
+ \ que vamos ganando altura.El ascenso culmina junto al parque eólico de Montejo,\
121
+ \ junto a un gran pinar y unas vistas espectaculares del pantano del Ebro y los\
122
+ \ hayedos que hemos recorrido.Descendemos con precaución por la pista hasta que\
123
+ \ nos desviamos por la senda que nos lleva junto a los eremitorios rupestres del\
124
+ \ Horno y de la tía Isidora.Abandonamos la ladera de la montaña hacia la localidad\
125
+ \ de Arnedo, desde la cual iremos por bonitos caminos entre praderas hacia el\
126
+ \ punto de inicio de la ruta. \n\nZonas de especial atención.-KM 4,5: Cruce de\
127
+ \ carretera nacional. Precaución con la circulación de vehículos.-KM 9-10: Tramo\
128
+ \ por carretera nacional. Transitar con precaución por el arcén.-KM 14,5: Tramo\
129
+ \ de unos 100m con una elevada pendiente por la ladera, imposible de subir en\
130
+ \ bici. La ruta sube paralela a la valla de ganado. Como alternativa, se puede\
131
+ \ continuar por camino que rodea la subida, teniendo que abrir y cerrar dos portillas\
132
+ \ de ganado.-KM 17,8: Desvío a la dcha hacia sendero poco visible, en pleno descenso\
133
+ \ por pista de fuerte pendiente. Descender con precaución para no pasarse el desvío.-KM18,2:\
134
+ \ Pequeño tramo de sendero estrecho no ciclable por la fuerte pendiente repentina.\
135
+ \ Aprox 25 metros\n\n\n\n\n\n\n\n\n sin_titulo.jpg\n \n \n \n \
136
+ \ \n\n \n\n\n\n\n\n\n\n\n\n\n\n\n logotipo_lineaverde_merindades.png"
137
+ - 'Título: PR-BU 101 Sendero de Caminos de Oña
138
+
139
+ Zona: Merindades
140
+
141
+ Duración: 4 h
142
+
143
+ Coordenadas: 42.718279,-3.394727
144
+
145
+ Tipo de recurso: Rutas-De senderos
146
+
147
+
148
+ PR-BU 101 Sendero de Caminos de Oña
149
+
150
+
151
+ Oña, la cuna del Condado de Castilla, ha sido tejida a lo largo de la historia,
152
+ por una densa red de caminos de diferente carácter. Ganaderos, carboneros, resineros,
153
+ madereros… todos ellos y muchos más han configurado un magnífico recurso para
154
+ la práctica del senderismo.El enorme pinar que caracteriza la Sierra de Oña se
155
+ complementa con grandes zonas cubiertas de boj y enormes pastizales que se extienden
156
+ a los pies del la Mesa de OñaLa historia y la naturaleza se dan de nuevo la mano,
157
+ como es habitual en este Parque Natural, a través de un sendero sin más dificultad
158
+ que la que se deriva de su longitud y desnivel.Claves para no perderse- Este sendero
159
+ de pequeño recorrido se inicia en la plaza del Mercado de Oña. Allí, junto al
160
+ muro de la finca aneja al Monasterio de San Salvador, se opta por el sentido del
161
+ recorrido. Aquí se propone tomar el ramal que sale de la villa hacia el sur, en
162
+ dirección a Pino de Bureba.- En las proximidades del término de Valdeperros el
163
+ PR gira a la izquierda e inicia un prolongado ascenso que culminará, después de
164
+ atravesar varias zonas boscosas, en el Corral del Prado.- Desde sus pastizales
165
+ se puede regresar a Oña por una pista que desciende entre enormes matorrales de
166
+ boj y encinas en dirección a Penches.- En este caso es preciso abandonar la citada
167
+ pista por una senda que sale a su izquierda poco antes de llegar a un cruce del
168
+ que parte otra hacia Barcina de los Montes.- La otra opción desde El Corral del
169
+ Prado es continuar hacia el este para acceder a la mesa de Oña o enlazar con el
170
+ PR de Barcina de los Montes.'
171
+ - "Título: Btt Dehesas Montijanas\nZona: Merindades\nDuración: 12 h\nCoordenadas:\
172
+ \ 43.03553,-3.4830100000000006\nTipo de recurso: Rutas-Territorio Ciclista-BTT\n\
173
+ \nBtt Dehesas Montijanas\n\nComenzamos ruta en la localidad de El Ribero de Montija.Desde\
174
+ \ el área recreativa y zona verde del pueblo, junto al río Cerneja, salimos callejeando\
175
+ \ hasta cruzar la carretera en dirección Norte, rodando entre dicho río y la montaña\
176
+ \ por caminos y pistas entre bosques de pino y roble.Unos km más adelante, cambiamos\
177
+ \ de rumbo totalmente transitando por caminos anchos sencillos entre los típicos\
178
+ \ prados montijanos, pasando por la bonita dehesa de Villasante, con ejemplares\
179
+ \ de robles centenarios.De ahí nos dirigimos al monte Edilla, donde haremos uno\
180
+ \ de los tramos más divertidos, por un sendero largo y revirado bajo un frondoso\
181
+ \ robledal y a orillas del río Trueba. Tras este bonito paso, volvemos a abrirnos\
182
+ \ a los praderíos, siempre por caminos de herradura y pista ancha, acercándonos\
183
+ \ a la gran dificultad de la ruta, la ascensión al monte de Bedón, con rampas\
184
+ \ duras que nos llevarán entre bonitos pinares y praderas altas.Tras un rápido\
185
+ \ descenso, llegamos a Bedón, donde afrontaremos una divertida trialera, con algunas\
186
+ \ zonas de pierda suelta y continuos sube y bajas, tras los que pasaremos por\
187
+ \ las extensas campas verdes de peña Horrero.TTras un bonito camino dominando\
188
+ \ las lagunas de Antuzanos, iremos descendiendo hacia la ribera del Trueba, por\
189
+ \ donde llegaremos cómodamente al punto final de ruta por caminos clásicos de\
190
+ \ herradura entre el río y las huertas de ribera.Zonas de especial atención:-KM\
191
+ \ 1: cruce de carretera nacional. Extremar precaución-KM 4-6: Tramo de pista y\
192
+ \ camino ancho con algunas roderas y charcos profundos creados por la lluvia.\
193
+ \ Transitar con precaución-KM 7: cruce de carretera nacional. Extremar precaución-KM\
194
+ \ 28-30: tramo por trialera técnica. Transitar con precaución-KM 36,5: cruce de\
195
+ \ carretera nacional. Extremar precaución\n\n\n\n\n\n\n\n\n btt-larga.jpg\n\
196
+ \ \n \n \n \n\n \n\n\n\n\n\n\n\n\n\n\n\n\n logotipo_lineaverde_merindades.png"
197
+ - source_sentence: ¿Cuál es la mejor época del año para realizar el Desafío Picón
198
+ Blanco?
199
+ sentences:
200
+ - "Título: Desafío Picón Blanco\nZona: Merindades\nDuración: 12 h\nCoordenadas:\
201
+ \ 43.066810942,-3.5361688899\nTipo de recurso: Rutas-Territorio Ciclista-Carretera\n\
202
+ \nDesafío Picón Blanco\n\nUn gran reto para los valientes que se atrevan a desafiar\
203
+ \ al exigente puerto de Picón Blanco.La ruta da comienzo en la histórica localidad\
204
+ \ de Espinosa de los Monteros, con el robledal del monte Edilla como cobijo. Tras\
205
+ \ unos primeros km de divertidos sube y bajas, llegamos a Villarcayo, desde donde\
206
+ \ rodamos por terreno llano, acompañados por el caudaloso río Nela hasta llegar\
207
+ \ a la pintoresca localidad de Puentedey, donde dicho río excavó el “puente de\
208
+ \ Dios”, una de las más impresionantes bellezas naturales de la comarca. Desde\
209
+ \ ahí, cambiamos de rumbo y nos adentramos en la Merindad de Sotoscueva por un\
210
+ \ recorrido rompepiernas que nos adentrará en los entresijos del Monumento natural\
211
+ \ de Ojo Guareña, serpenteando por sus innumerables desfiladeros calizos, que\
212
+ \ esconden el complejo de cuevas más importante de la península. A la salida del\
213
+ \ último desfiladero de las Hornillas, el valle se abre hacia los característicos\
214
+ \ praderíos pasiegos que nos enfilan de nuevo a Espinosa, donde casi sin aviso,\
215
+ \ comenzará la ascensión final al mítico coloso de Picón Blanco, con rampas superiores\
216
+ \ al 18% por las que se asciende hasta los 1518m de altitud, y donde este 2021\
217
+ \ se disputarán el maillot rojo los participantes de la Vuelta ciclista a España.\n\
218
+ \nZonas de especial atención\n\n\n\n\n\n\n\n bttdificil.jpg\n \n \n\
219
+ \ \n \n\n \n\n\n\n\n\n-KM 71: Ascenso al puerto de Picón Blanco. Puerto\
220
+ \ de gran desnivel (750m) y con pendientes que superan en algunos puntos el 18%.\
221
+ \ En época invernal puede encontrarse cortado por neveros, ya que se asciende\
222
+ \ hasta los 1.500 metros de altitud.\n\n\n\n\n\n\n\n\n logotipo_lineaverde_merindades.png"
223
+ - "Título: Iglesia de la Natividad de Nuestra Señora. Galbarros\nZona: Bureba\n\
224
+ Duración: \nCoordenadas: 42.52951974736,-3.4377064299357\nTipo de recurso: Patrimonio,\
225
+ \ Románico\n\nIglesia de la Natividad de Nuestra Señora. Galbarros\n\n"
226
+ - 'Título: PRC-BU 183 Sendero de Fuente Sagredo
227
+
228
+ Zona: Merindades
229
+
230
+ Duración: 2 h 30 min
231
+
232
+ Coordenadas: 42.808774,-3.523065
233
+
234
+ Tipo de recurso: Rutas-De senderos
235
+
236
+
237
+ PRC-BU 183 Sendero de Fuente Sagredo
238
+
239
+
240
+ El Sendero de Fuente Sagredo, es una bella ruta circular cuyo punto de partida
241
+ se encuentra en la localidad de Condado de Valdivielso.Con la ribera del Ebro
242
+ como protagonista, en su recorrido, perfectamente señalizado, disfrutarás de impresionantes
243
+ panorámicas del valle de Valdivielso y descubrirás la cueva de origen Kárstico
244
+ de Fuente Sagredo.'
245
+ - source_sentence: ¿Existen áreas de picnic o zonas de descanso en los Montes de Valnera?
246
+ sentences:
247
+ - "Título: Montes de Valnera\nZona: Merindades\nDuración: \nCoordenadas: \nTipo\
248
+ \ de recurso: Rutas-De pajareo\n\nMontes de Valnera\n\nLos montes de Valnera se\
249
+ \ sitúan en el macizo de Castro Valnera perteneciente a la Cordillera Cantábrica,\
250
+ \ en el municipio de Espinosa de los Monteros. El punto más alto es el Castro\
251
+ \ Valnera situado en la cumbre del circo de Lunada (1.718 m.).Bellos paisajes\
252
+ \ fruto del glaciarismo cuaternario, que junto con la acción del hombre y su arquitectura\
253
+ \ tradicional de cabañas y muros, modelaron estas tierras haciéndolas únicas.El\
254
+ \ interés ambiental de los montes de Valnera radica en su situación relativamente\
255
+ \ aislada; la extrema humedad y la gran variedad litológica, han supuesto el aislamiento\
256
+ \ de las comunidades vegetales, principalmente de las zonas higroturbosas y turberas\
257
+ \ de alta montaña. La diversidad de su flora presenta endemismos y especies boreoalpinas.Existe\
258
+ \ un gran contraste entre las crestas calcáreas, grandes extensiones de lapiaz\
259
+ \ y las lomas silíceas cubiertas de pastizal o matorral.Los estratos calizos y\
260
+ \ silíceos alternan de manera regular, dando una fisonomía muy particular al macizo,\
261
+ \ que se eleva en terrazas sucesivas y da lugar a interesantes contrastes desde\
262
+ \ el punto de vista de la vegetación.\nLAS AVESResidentesGavilán común – Cernícalo\
263
+ \ vulgar – Halcón peregrino – Perdiz roja – Perdiz pardilla – Chocha perdiz –\
264
+ \ Pito real – Pito negro – Bisbita alpino – Chochín – Acentor común – Acentor\
265
+ \ alpino – Mosquiteros ibérico – Reyezuelo listado – Carbonero palustre – Trepador\
266
+ \ azul – Agateador común – Chova pinquigüalda – Verderón serrano.De pasoPapamoscas\
267
+ \ cerrojillo – Lúgano.EstivalesAlimoche – Culebrera europea – Aguilucho palido\
268
+ \ – Aguilucho cenizo – Codorniz – Avión roquero – Bisbita arbóreo – Colirrojo\
269
+ \ real – Collalba gris – Roquero rojo – Zarcero común – Curruca mosquitera – Papamoscas\
270
+ \ cerrojillo – Alcaudón dorsirrojo.InvernantesZorzal alirrojo – Estornino pinto\
271
+ \ – Gorrión alpino.\nÉPOCA RECOMENDADAPrimaveraNidificación de las aves rupícolas,\
272
+ \ forestales y todas aquellas relacionadas con los herbazales, como los alaúdidos.VeranoSiguen\
273
+ \ la nidificación de algunas especies, también podemos contemplar los vuelos de\
274
+ \ jóvenes pollos de las polladas primaverales.OtoñoEl otoño además de poner los\
275
+ \ matices cromáticos, es la época por la que pasan gran cantidad de aves en pleno\
276
+ \ periodo migratorio."
277
+ - 'Título: SLC-BU 98 Sendero de San Zadornil
278
+
279
+ Zona: Merindades
280
+
281
+ Duración: 3 h 30 min
282
+
283
+ Coordenadas: 42.842480,-3.158652
284
+
285
+ Tipo de recurso: Rutas-De senderos
286
+
287
+
288
+ SLC-BU 98 Sendero de San Zadornil
289
+
290
+
291
+ Este sendero parte de uno de los pueblos que mejor ha sabido conservar el sabor
292
+ de la tradición de Las Merindades.El armonioso conjunto urbano de la capital de
293
+ la Jurisdicción de San Zadornil, sobre cuyos edificios sobresale la esbelta torre
294
+ románica de la iglesia de San Saturnino, resulta de un gran atractivo. Los pajares,
295
+ los molinos, la escuela… y su magnífica ubicación, conforman un marco idóneo para
296
+ el inicio de esta ruta.El camino, casi totalmente trazado sobre pistas forestales
297
+ integradas en un paisaje de gran magnitud, transita por la ladera septentrional
298
+ de la Sierra de Árcena, donde la densa vegetación realza aún más el interés del
299
+ paseo.Pinos, castaños y hayas son los principales ingredientes del sendero de
300
+ San Zadornil, apto para la mayor parte de los públicos.Claves para no perderse:-
301
+ Salida desde la fuente situada junto a los pajares por la carretera de Villafría
302
+ de San Zadornil. Llegados a la primera pista forestal, el PR abandona dicha carretera
303
+ por la izquierda y se introduce por ella hacia el castañar.- Caseta de agua y
304
+ cruce de pistas. Inicio de una variante por la izquierda. El PR continúa de frente.
305
+ De tomar la opción de la variante, esta vuelve a contactar el sendero principal
306
+ después de pasar junto a una área recreativa.- La pista realiza una pronunciada
307
+ curva y el PR abandona por una senda. La pista vuelve a contactar con el sendero
308
+ más arriba.- El sendero llega a la presa de retención del agua que mueve las
309
+ piedras de los molinos y desde ella desciende hacia el pueblo.'
310
+ - "Título: PRC BU 42 Senda circular los Miradores\nZona: Merindades\nDuración: 1h\
311
+ \ 30 min\nCoordenadas: 42.942432,-3.000004\nTipo de recurso: Rutas-De senderos\n\
312
+ \nPRC BU 42 Senda circular los Miradores\n\nCon punto de inicio y final en el\
313
+ \ paraje de Fuente Santiago, en el corazón del Monumento Natural, esta ruta dibuja\
314
+ \ un amplio recorrido circular que conecta los miradores del Salto del Nervión\
315
+ \ y de Esquina Rubén, sin duda dos de los principales puntos de interés paisajístico\
316
+ \ de este espacio protegido.En Fuente Santiago, se toma la pista forestal, compartida\
317
+ \ con el PR-BU 45, que se dirige al mirador del Salto del Nervión, en un trazado\
318
+ \ fácil, llano y de buen firme que discurre a través del hayedo. Acercándose al\
319
+ \ límite del bosque, la ruta pasa al lado de la Lobera de Santiago, donde se conserva\
320
+ \ la estructura de una ancestral trampa para el lobo, formada por empalizadas\
321
+ \ y muros que confluían en un pozo. Un conjunto de grandes figuras recrea la escena\
322
+ \ de una batida con los mozos acosando al lobo.Pasada la lobera, la pista abandona\
323
+ \ la protección del bosque y sale a un descampado que se ve interrumpido bruscamente\
324
+ \ por los vertiginosos acantilados de sierra Salvada. El camino conduce finalmente\
325
+ \ a un balcón colgado desde el que se sobrevuela el cañón de Délika con la misma\
326
+ \ perspectiva que tienen los buitres que pasan planeando frente al mirador. Numerosas\
327
+ \ surgencias brotan de las paredes que cierran el cañón dando nacimiento al río\
328
+ \ Nervión, aunque es en periodos de lluvias intensas, o después de fuertes tormentas,\
329
+ \ cuando este espectáculo alcanza su máximo esplendor, con saltos de agua que\
330
+ \ se precipitan al abismo con violencia y se deshilachaban en nubes de vapor por\
331
+ \ efecto del viento.Desde el mirador del Salto del Nervión, la ruta prosigue por\
332
+ \ una senda estrecha que discurre siempre pegada a los acantilados y va descubriendo\
333
+ \ sucesivos rincones tan fotogénicos como vertiginosos. En este trayecto, se alcanza\
334
+ \ enseguida una segunda lobera, conocida como Foso Nuevo. Justo en este punto\
335
+ \ se encuentra también una intersección, donde el PRC-BU 41 (la senda circular\
336
+ \ del karst), que hasta este momento había discurrido superpuesta a nuestro itinerario,\
337
+ \ se desvía al oeste por el interior del bosque. Nuestro itinerario continúa,\
338
+ \ en cambio, por el borde del acantilado, aprovechando una estrecha franja despejada\
339
+ \ entre el cortado y el lindero del bosque. Esta vereda va ganando altura progresivamente\
340
+ \ hasta salir al mirador de Esquina Rubén, que ocupa un saliente desde el que\
341
+ \ se domina una amplia panorámica: al oeste, los cantiles de Sierra Salvada, con\
342
+ \ el monte y ermita del Charlazo, frente a nosotros el valle de Orduña y su salida\
343
+ \ natural por el valle de Ayala hacia la costa del Cantábrico, y al este los cortados\
344
+ \ que flanquean el cañón de Délica y los relieves del Gorbea.En Esquina Rubén,\
345
+ \ la ruta gira bruscamente al sur por un camino forestal que conduce hacia el\
346
+ \ corazón de Monte Santiago a través de un precioso hayedo asentado sobre un sustrato\
347
+ \ profundamente karstificado, repleto de dolinas y lapiaces. Este tramo nos devuelve\
348
+ \ en progresivo descenso al lugar de partida en Fuente Santiago, paraje que concentra\
349
+ \ varios puntos de interés que podemos aprovechar para visitar a la vuelta de\
350
+ \ este itinerario. Todos ellos se sitúan en el entorno de la Casa del Parque de\
351
+ \ Monte Santiago. Este centro de interpretación y recepción de visitantes contiene\
352
+ \ una completa exposición sobre el espacio natural protegido. Se localiza en el\
353
+ \ mismo emplazamiento que antaño ocupó el monasterio medieval de Santiago de Langrériz,\
354
+ \ del que perduran restos de varias construcciones. Este cenobio no fue erigido\
355
+ \ en este lugar por casualidad, sino que se asentaba al lado de la surgencia de\
356
+ \ Fuente Santiago, que es el único punto de agua permanente de la zona. Esta surgencia\
357
+ \ se puede ver en el fondo de una dolina de colapso a los pies de la Casa del\
358
+ \ Parque, donde brota un arroyo subterráneo que sale a la superficie en un corto\
359
+ \ trecho de apenas 50 m de longitud antes de volver a perderse en las entrañas\
360
+ \ del karst por un sumidero. También en este rincón llama la atención un haya\
361
+ \ monumental, que alcanza los 21 m de altura y está recogida en el Catálogo de\
362
+ \ Especímenes Vegetales de Singular Relevancia de Castilla y León con el código\
363
+ \ AS-BU-19.\n\n\n\n\n\n\n\n\n presentacion1.jpg\n \n \n \n \n\
364
+ \n \n\n\n\n\nInformación cedida por:"
365
+ - source_sentence: ¿Cómo puedo llegar al PRC-BU 67 'Las salinas de Poza' desde la
366
+ ciudad más cercana?
367
+ sentences:
368
+ - "Título: Ruta de las manzanas\nZona: Merindades\nDuración: \nCoordenadas: \nTipo\
369
+ \ de recurso: Destacados-Qué hacer\n\nRuta de las manzanas\n\nEtimológicamente,\
370
+ \ Medina de Pomar es (ciudad de las manzanas) y prueba de ello son las 12 manzanas\
371
+ \ que esconde el Casco Histórico de la ciudad en puntos estratégicos que conducen\
372
+ \ al visitante a través de las calles de un conjunto histórico declarado como\
373
+ \ tal en 1973.\nEn la Oficina de Turismo de Medina de Pomar y en el Museo Histórico\
374
+ \ de las Merindades se reparten los cuadernos de ruta, que sirven de mapa y guía.\
375
+ \ Además, los cuadernos están diseñados para poder completarlos con las aportaciones\
376
+ \ propias de cada uno, con lo que se consigue una mayor implicación y disfrute\
377
+ \ del recorrido, pensado también para los más pequeños de la familia con el aliciente\
378
+ \ que supone la búsqueda de cada una de las manzanas en el mapa.\nEstas manzanas,\
379
+ \ están decoradas por pintores de la ciudad, por lo que es una iniciativa que\
380
+ \ aúna turismo y arte local."
381
+ - 'Título: PRC-BU 67 "Las salinas de Poza"
382
+
383
+ Zona: La Bureba
384
+
385
+ Duración: 1 h 50 min
386
+
387
+ Coordenadas: 42.667433023,-3.502216972
388
+
389
+ Tipo de recurso: Rutas y senderos, Senderos
390
+
391
+
392
+ PRC-BU 67 "Las salinas de Poza"
393
+
394
+
395
+ El sendero PRC-BU 67 recorre parte del salero contemplando las eras, los pozos
396
+ y los restos de los almacenes de La Magdalena y Trascastro. Este recorrido pasa
397
+ también junto al castillo y el palacio y recorre una parte del conjunto urbano
398
+ de Poza de la Sal'
399
+ - "Título: BTT | Ribera del Jerea\nZona: Merindades\nDuración: 12 h\nCoordenadas:\
400
+ \ 42.84819,-3.3346299999999998\nTipo de recurso: Rutas-Territorio Ciclista-BTT\n\
401
+ \nBTT | Ribera del Jerea\n\nComenzamos ruta en la localidad de Pedrosa de Tobalina,\
402
+ \ junto a la espectacular cascada del Peñón, formada por el río Jerea.Remontando\
403
+ \ dicho río realizamos la primera parte de la ruta, por caminos anchos junto\
404
+ \ al río, hasta llegar a Quintanilla Entrepeñas, a la que llegaremos tras atravesar\
405
+ \ un pequeño desfiladero.Tras esta localidad, nos desviamos, adentrándonos en\
406
+ \ zona montañosa, por pistas y caminos forestales de gran belleza, por los que\
407
+ \ atravesaremos la peña Redonda, rodeados en todo momento de extensos pinares\
408
+ \ y robledales y algunas zonas rocosas.Regresamos hacia la ribera del Jerea, en\
409
+ \ este caso río abajo y por la otra margen, recorriendo varios km de caminos rápidos\
410
+ \ y divertidos con bonitas vistas puntuales sobre el río, llegando casi hasta\
411
+ \ su desembocadura en el Ebro, donde de nuevo cambiamos el rumbo completamente,\
412
+ \ para introducirnos en un pequeño monte entre pinares, tras el cual volvemos\
413
+ \ nuevamente a la ribera del Jerea.Los últimos km los haremos disfrutando de los\
414
+ \ bosques y senderos de ribera de Santotis y Cadiñanos, donde pasaremos junto\
415
+ \ a su tan apreciada zona de baños. Continuaremos para finalizar la ruta en el\
416
+ \ punto de inicio, la Cascada del Peñón.\n \n\n\n\n\n\n\n\n\n\n bttmedia.jpg\n\
417
+ \ \n \n \n \n\n \n\n\n\n\nZonas de especial atención:\n-KM 1-4: Tramo\
418
+ \ por zona inundable del río Jerea. No realizar en caso de crecida fuerte. El\
419
+ \ tramo se puede evitar fácilmente saliendo a la carretera BU-550 hasta Quintanilla-Entrepeñas,\
420
+ \ donde se puede volver a la ruta y realizar normalmente hasta el final.-KM 25-27:\
421
+ \ Tramo de sendero, con zonas estrechas y algún paso donde apearse para sortear\
422
+ \ pasos de agua o rocas sin mucha dificultad.-KM 27,5: Paso junto a la presa de\
423
+ \ Cadiñanos, con un paso estrecho peatonal de acceso a la zona de baños. Pasar\
424
+ \ desmontados de la bici.\n\n\n\n\n\n\n\n\n logotipo_lineaverde_merindades.png"
425
+ pipeline_tag: sentence-similarity
426
+ library_name: sentence-transformers
427
+ metrics:
428
+ - pearson_cosine
429
+ - spearman_cosine
430
+ model-index:
431
+ - name: SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
432
+ results:
433
+ - task:
434
+ type: semantic-similarity
435
+ name: Semantic Similarity
436
+ dataset:
437
+ name: val
438
+ type: val
439
+ metrics:
440
+ - type: pearson_cosine
441
+ value: 0.9508069706693815
442
+ name: Pearson Cosine
443
+ - type: spearman_cosine
444
+ value: 0.8650863054332286
445
+ name: Spearman Cosine
446
+ ---
447
+
448
+ # SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
449
+
450
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
451
+
452
+ ## Model Details
453
+
454
+ ### Model Description
455
+ - **Model Type:** Sentence Transformer
456
+ - **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) <!-- at revision 86741b4e3f5cb7765a600d3a3d55a0f6a6cb443d -->
457
+ - **Maximum Sequence Length:** 512 tokens
458
+ - **Output Dimensionality:** 768 dimensions
459
+ - **Similarity Function:** Cosine Similarity
460
+ <!-- - **Training Dataset:** Unknown -->
461
+ <!-- - **Language:** Unknown -->
462
+ <!-- - **License:** Unknown -->
463
+
464
+ ### Model Sources
465
+
466
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
467
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
468
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
469
+
470
+ ### Full Model Architecture
471
+
472
+ ```
473
+ SentenceTransformer(
474
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
475
+ (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
476
+ (2): Normalize()
477
+ )
478
+ ```
479
+
480
+ ## Usage
481
+
482
+ ### Direct Usage (Sentence Transformers)
483
+
484
+ First install the Sentence Transformers library:
485
+
486
+ ```bash
487
+ pip install -U sentence-transformers
488
+ ```
489
+
490
+ Then you can load this model and run inference.
491
+ ```python
492
+ from sentence_transformers import SentenceTransformer
493
+
494
+ # Download from the 🤗 Hub
495
+ model = SentenceTransformer("gpellejero/sodebur")
496
+ # Run inference
497
+ sentences = [
498
+ "¿Cómo puedo llegar al PRC-BU 67 'Las salinas de Poza' desde la ciudad más cercana?",
499
+ 'Título: PRC-BU 67 "Las salinas de Poza"\nZona: La Bureba\nDuración: 1 h 50 min\nCoordenadas: 42.667433023,-3.502216972\nTipo de recurso: Rutas y senderos, Senderos\n\nPRC-BU 67 "Las salinas de Poza"\n\nEl sendero PRC-BU 67 recorre parte del salero contemplando las eras, los pozos y los restos de los almacenes de La Magdalena y Trascastro. Este recorrido pasa también junto al castillo y el palacio y recorre una parte del conjunto urbano de Poza de la Sal',
500
+ 'Título: BTT | Ribera del Jerea\nZona: Merindades\nDuración: 12 h\nCoordenadas: 42.84819,-3.3346299999999998\nTipo de recurso: Rutas-Territorio Ciclista-BTT\n\nBTT | Ribera del Jerea\n\nComenzamos ruta en la localidad de Pedrosa de Tobalina, junto a la espectacular cascada del Peñón, formada por el río Jerea.Remontando dicho río realizamos la primera parte de la ruta, por caminos anchos junto al río, hasta llegar a Quintanilla Entrepeñas, a la que llegaremos tras atravesar un pequeño desfiladero.Tras esta localidad, nos desviamos, adentrándonos en zona montañosa, por pistas y caminos forestales de gran belleza, por los que atravesaremos la peña Redonda, rodeados en todo momento de extensos pinares y robledales y algunas zonas rocosas.Regresamos hacia la ribera del Jerea, en este caso río abajo y por la otra margen, recorriendo varios km de caminos rápidos y divertidos con bonitas vistas puntuales sobre el río, llegando casi hasta su desembocadura en el Ebro, donde de nuevo cambiamos el rumbo completamente, para introducirnos en un pequeño monte entre pinares, tras el cual volvemos nuevamente a la ribera del Jerea.Los últimos km los haremos disfrutando de los bosques y senderos de ribera de Santotis y Cadiñanos, donde pasaremos junto a su tan apreciada zona de baños. Continuaremos para finalizar la ruta en el punto de inicio, la Cascada del Peñón.\n \n\n\n\n\n\n\n\n\n\n bttmedia.jpg\n \n \n \n \n\n \n\n\n\n\nZonas de especial atención:\n-KM 1-4: Tramo por zona inundable del río Jerea. No realizar en caso de crecida fuerte. El tramo se puede evitar fácilmente saliendo a la carretera BU-550 hasta Quintanilla-Entrepeñas, donde se puede volver a la ruta y realizar normalmente hasta el final.-KM 25-27: Tramo de sendero, con zonas estrechas y algún paso donde apearse para sortear pasos de agua o rocas sin mucha dificultad.-KM 27,5: Paso junto a la presa de Cadiñanos, con un paso estrecho peatonal de acceso a la zona de baños. Pasar desmontados de la bici.\n\n\n\n\n\n\n\n\n logotipo_lineaverde_merindades.png',
501
+ ]
502
+ embeddings = model.encode(sentences)
503
+ print(embeddings.shape)
504
+ # [3, 768]
505
+
506
+ # Get the similarity scores for the embeddings
507
+ similarities = model.similarity(embeddings, embeddings)
508
+ print(similarities.shape)
509
+ # [3, 3]
510
+ ```
511
+
512
+ <!--
513
+ ### Direct Usage (Transformers)
514
+
515
+ <details><summary>Click to see the direct usage in Transformers</summary>
516
+
517
+ </details>
518
+ -->
519
+
520
+ <!--
521
+ ### Downstream Usage (Sentence Transformers)
522
+
523
+ You can finetune this model on your own dataset.
524
+
525
+ <details><summary>Click to expand</summary>
526
+
527
+ </details>
528
+ -->
529
+
530
+ <!--
531
+ ### Out-of-Scope Use
532
+
533
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
534
+ -->
535
+
536
+ ## Evaluation
537
+
538
+ ### Metrics
539
+
540
+ #### Semantic Similarity
541
+
542
+ * Dataset: `val`
543
+ * Evaluated with [<code>EmbeddingSimilarityEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
544
+
545
+ | Metric | Value |
546
+ |:--------------------|:-----------|
547
+ | pearson_cosine | 0.9508 |
548
+ | **spearman_cosine** | **0.8651** |
549
+
550
+ <!--
551
+ ## Bias, Risks and Limitations
552
+
553
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
554
+ -->
555
+
556
+ <!--
557
+ ### Recommendations
558
+
559
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
560
+ -->
561
+
562
+ ## Training Details
563
+
564
+ ### Training Dataset
565
+
566
+ #### Unnamed Dataset
567
+
568
+ * Size: 3,726 training samples
569
+ * Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>sentence_2</code>
570
+ * Approximate statistics based on the first 1000 samples:
571
+ | | sentence_0 | sentence_1 | sentence_2 |
572
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
573
+ | type | string | string | string |
574
+ | details | <ul><li>min: 10 tokens</li><li>mean: 21.68 tokens</li><li>max: 34 tokens</li></ul> | <ul><li>min: 31 tokens</li><li>mean: 255.62 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 33 tokens</li><li>mean: 482.05 tokens</li><li>max: 512 tokens</li></ul> |
575
+ * Samples:
576
+ | sentence_0 | sentence_1 | sentence_2 |
577
+ |:-------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
578
+ | <code>¿Se pueden alquilar bicicletas en Btt Por la Metrópoli Verde?</code> | <code>Título: Btt Por la Metrópoli Verde<br>Zona: Merindades<br>Duración: 12 h<br>Coordenadas: 42.8423966253,-3.1588822865<br>Tipo de recurso: Rutas-Territorio Ciclista-BTT<br><br>Btt Por la Metrópoli Verde<br><br>Comenzamos ruta en San Zadornil.Desde la amplia zona de parking y área de descanso habilitada, salimos en dirección al pueblo, donde podremos disfrutar en primer término de sus tranquilas callejuelas y su bien conservada iglesia de San Saturnino.Abandonamos el pueblo por una bonita callejuela que nos introduce de lleno en los frondosos y extensos bosques de la “metrópoli verde”por un camino de herradura con abundante vegetación en verano.Nos enfrentamos a la parte más dura de la ruta, con una subida de casi medio km con una pendiente importante, donde es posible que tengamos que echar pie a tierra, pero que sólo será por un corto recorrido.A partir de aquí, tenemos unos km de terreno que alterna tramos llanos con algún sube y baja suave, siempre dentro del bosque, y con bonitas vistas a nuestra derecha de...</code> | <code>Título: SLC-BU 109 Sendero de Montejo de San Miguel<br>Zona: Merindades<br>Duración: 1 h<br>Coordenadas: 42.765037,-3.270867<br>Tipo de recurso: Rutas-De senderos<br><br>SLC-BU 109 Sendero de Montejo de San Miguel<br><br>La senda está pensada como un paseo junto al río Ebro, la Ermita de San Miguel y los restos de las antiguas tejera y carboneras que han sido recuperados. Todo esto dentro de un itinerario didáctico botánico, donde se ha señalado, a lo largo del recorrido, una buena colección de las especies que marcan la gran diversidad florística de la zona.La ruta es circular, pero recomendamos hacerla en el sentido que marcamos en esta entrada. Llegados a Montejo de San Miguel, junto a la plaza nos toparemos con el panel explicativo de la senda, así como una señal que nos envía a la izquierda, al aparcamiento habilitado para comenzar la caminata. Ojo con el panel, que aún refleja el recorrido antiguo. Este ha cambiado en parte, ya que ahora el paseo incluye un tramo por la parte alta del monte.En este inic...</code> |
579
+ | <code>¿Qué recomendaciones de seguridad hay para visitar 'Por las loberas de Losa'?</code> | <code>Título: Por las loberas de Losa<br>Zona: Merindades<br>Duración: 3 h 30 min<br>Coordenadas: <br>Tipo de recurso: Rutas-Territorio Ciclista<br><br>Por las loberas de Losa<br><br>En bici de carreteraUn recorrido ideal para ciclistas entrenados. Algo más de 100 kilómetros por un terreno variado y lleno de contrastes.Información proporcianada por: http://www.porelnortedeburgos.com<br><br><br><br><br><br><br><br><br> logo_por_el_norte_de_burgos.jpg</code> | <code>Título: BTT | Ribera del Jerea<br>Zona: Merindades<br>Duración: 12 h<br>Coordenadas: 42.84819,-3.3346299999999998<br>Tipo de recurso: Rutas-Territorio Ciclista-BTT<br><br>BTT | Ribera del Jerea<br><br>Comenzamos ruta en la localidad de Pedrosa de Tobalina, junto a la espectacular cascada del Peñón, formada por el río Jerea.Remontando dicho río realizamos la primera parte de la ruta, por caminos anchos junto al río, hasta llegar a Quintanilla Entrepeñas, a la que llegaremos tras atravesar un pequeño desfiladero.Tras esta localidad, nos desviamos, adentrándonos en zona montañosa, por pistas y caminos forestales de gran belleza, por los que atravesaremos la peña Redonda, rodeados en todo momento de extensos pinares y robledales y algunas zonas rocosas.Regresamos hacia la ribera del Jerea, en este caso río abajo y por la otra margen, recorriendo varios km de caminos rápidos y divertidos con bonitas vistas puntuales sobre el río, llegando casi hasta su desembocadura en el Ebro, donde de nuevo cambiamos el rumbo c...</code> |
580
+ | <code>¿Se requiere algún permiso para realizar el PR-BU 106 Sendas Resineras de la Llana?</code> | <code>Título: PR-BU 106 Sendas Resineras de la Llana<br>Zona: Merindades<br>Duración: 3 h 30 min<br>Coordenadas: 42.780494,-3.358559<br>Tipo de recurso: Rutas-De senderos<br><br>PR-BU 106 Sendas Resineras de la Llana<br><br>La extracción de la resina de los pinos de la Sierra de la Llana ha constituido tradicionalmente uno de los pilares de la frágil economía de los pueblos del entorno de Oña. Fue allí, precisamente, donde se establecieron los almacenes de resina, la resinera, que aún puede verse en las proximidades de la finca de La Santé.Las sendas de Villanueva, Cillaperlata y Oña que constituyeron las vías por las que los resineros se adentraron en el monte forman hoy parte de la red de senderos del Parque Natural de los Montes Obarenes-San Zadornil y no hay que olvidar que el paisaje que observamos fue escenario de algunos de los momentos históricos más significativos de Castilla en los tiempos en los que ésta apenas acababa de nacer. Por ello, no debe extrañar la presencia del monasterio de San Juan de Hoz, e...</code> | <code>Título: BTT | Ribera del Jerea<br>Zona: Merindades<br>Duración: 12 h<br>Coordenadas: 42.84819,-3.3346299999999998<br>Tipo de recurso: Rutas-Territorio Ciclista-BTT<br><br>BTT | Ribera del Jerea<br><br>Comenzamos ruta en la localidad de Pedrosa de Tobalina, junto a la espectacular cascada del Peñón, formada por el río Jerea.Remontando dicho río realizamos la primera parte de la ruta, por caminos anchos junto al río, hasta llegar a Quintanilla Entrepeñas, a la que llegaremos tras atravesar un pequeño desfiladero.Tras esta localidad, nos desviamos, adentrándonos en zona montañosa, por pistas y caminos forestales de gran belleza, por los que atravesaremos la peña Redonda, rodeados en todo momento de extensos pinares y robledales y algunas zonas rocosas.Regresamos hacia la ribera del Jerea, en este caso río abajo y por la otra margen, recorriendo varios km de caminos rápidos y divertidos con bonitas vistas puntuales sobre el río, llegando casi hasta su desembocadura en el Ebro, donde de nuevo cambiamos el rumbo c...</code> |
581
+ * Loss: [<code>TripletLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#tripletloss) with these parameters:
582
+ ```json
583
+ {
584
+ "distance_metric": "TripletDistanceMetric.COSINE",
585
+ "triplet_margin": 0.7
586
+ }
587
+ ```
588
+
589
+ ### Training Hyperparameters
590
+ #### Non-Default Hyperparameters
591
+
592
+ - `eval_strategy`: steps
593
+ - `per_device_train_batch_size`: 32
594
+ - `per_device_eval_batch_size`: 32
595
+ - `num_train_epochs`: 1
596
+ - `fp16`: True
597
+ - `multi_dataset_batch_sampler`: round_robin
598
+
599
+ #### All Hyperparameters
600
+ <details><summary>Click to expand</summary>
601
+
602
+ - `overwrite_output_dir`: False
603
+ - `do_predict`: False
604
+ - `eval_strategy`: steps
605
+ - `prediction_loss_only`: True
606
+ - `per_device_train_batch_size`: 32
607
+ - `per_device_eval_batch_size`: 32
608
+ - `per_gpu_train_batch_size`: None
609
+ - `per_gpu_eval_batch_size`: None
610
+ - `gradient_accumulation_steps`: 1
611
+ - `eval_accumulation_steps`: None
612
+ - `torch_empty_cache_steps`: None
613
+ - `learning_rate`: 5e-05
614
+ - `weight_decay`: 0.0
615
+ - `adam_beta1`: 0.9
616
+ - `adam_beta2`: 0.999
617
+ - `adam_epsilon`: 1e-08
618
+ - `max_grad_norm`: 1
619
+ - `num_train_epochs`: 1
620
+ - `max_steps`: -1
621
+ - `lr_scheduler_type`: linear
622
+ - `lr_scheduler_kwargs`: {}
623
+ - `warmup_ratio`: 0.0
624
+ - `warmup_steps`: 0
625
+ - `log_level`: passive
626
+ - `log_level_replica`: warning
627
+ - `log_on_each_node`: True
628
+ - `logging_nan_inf_filter`: True
629
+ - `save_safetensors`: True
630
+ - `save_on_each_node`: False
631
+ - `save_only_model`: False
632
+ - `restore_callback_states_from_checkpoint`: False
633
+ - `no_cuda`: False
634
+ - `use_cpu`: False
635
+ - `use_mps_device`: False
636
+ - `seed`: 42
637
+ - `data_seed`: None
638
+ - `jit_mode_eval`: False
639
+ - `use_ipex`: False
640
+ - `bf16`: False
641
+ - `fp16`: True
642
+ - `fp16_opt_level`: O1
643
+ - `half_precision_backend`: auto
644
+ - `bf16_full_eval`: False
645
+ - `fp16_full_eval`: False
646
+ - `tf32`: None
647
+ - `local_rank`: 0
648
+ - `ddp_backend`: None
649
+ - `tpu_num_cores`: None
650
+ - `tpu_metrics_debug`: False
651
+ - `debug`: []
652
+ - `dataloader_drop_last`: False
653
+ - `dataloader_num_workers`: 0
654
+ - `dataloader_prefetch_factor`: None
655
+ - `past_index`: -1
656
+ - `disable_tqdm`: False
657
+ - `remove_unused_columns`: True
658
+ - `label_names`: None
659
+ - `load_best_model_at_end`: False
660
+ - `ignore_data_skip`: False
661
+ - `fsdp`: []
662
+ - `fsdp_min_num_params`: 0
663
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
664
+ - `tp_size`: 0
665
+ - `fsdp_transformer_layer_cls_to_wrap`: None
666
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
667
+ - `deepspeed`: None
668
+ - `label_smoothing_factor`: 0.0
669
+ - `optim`: adamw_torch
670
+ - `optim_args`: None
671
+ - `adafactor`: False
672
+ - `group_by_length`: False
673
+ - `length_column_name`: length
674
+ - `ddp_find_unused_parameters`: None
675
+ - `ddp_bucket_cap_mb`: None
676
+ - `ddp_broadcast_buffers`: False
677
+ - `dataloader_pin_memory`: True
678
+ - `dataloader_persistent_workers`: False
679
+ - `skip_memory_metrics`: True
680
+ - `use_legacy_prediction_loop`: False
681
+ - `push_to_hub`: False
682
+ - `resume_from_checkpoint`: None
683
+ - `hub_model_id`: None
684
+ - `hub_strategy`: every_save
685
+ - `hub_private_repo`: None
686
+ - `hub_always_push`: False
687
+ - `gradient_checkpointing`: False
688
+ - `gradient_checkpointing_kwargs`: None
689
+ - `include_inputs_for_metrics`: False
690
+ - `include_for_metrics`: []
691
+ - `eval_do_concat_batches`: True
692
+ - `fp16_backend`: auto
693
+ - `push_to_hub_model_id`: None
694
+ - `push_to_hub_organization`: None
695
+ - `mp_parameters`:
696
+ - `auto_find_batch_size`: False
697
+ - `full_determinism`: False
698
+ - `torchdynamo`: None
699
+ - `ray_scope`: last
700
+ - `ddp_timeout`: 1800
701
+ - `torch_compile`: False
702
+ - `torch_compile_backend`: None
703
+ - `torch_compile_mode`: None
704
+ - `include_tokens_per_second`: False
705
+ - `include_num_input_tokens_seen`: False
706
+ - `neftune_noise_alpha`: None
707
+ - `optim_target_modules`: None
708
+ - `batch_eval_metrics`: False
709
+ - `eval_on_start`: False
710
+ - `use_liger_kernel`: False
711
+ - `eval_use_gather_object`: False
712
+ - `average_tokens_across_devices`: False
713
+ - `prompts`: None
714
+ - `batch_sampler`: batch_sampler
715
+ - `multi_dataset_batch_sampler`: round_robin
716
+
717
+ </details>
718
+
719
+ ### Training Logs
720
+ | Epoch | Step | val_spearman_cosine |
721
+ |:------:|:----:|:-------------------:|
722
+ | 0.8547 | 100 | 0.8653 |
723
+ | 1.0 | 117 | 0.8651 |
724
+
725
+
726
+ ### Framework Versions
727
+ - Python: 3.12.3
728
+ - Sentence Transformers: 4.1.0
729
+ - Transformers: 4.51.3
730
+ - PyTorch: 2.7.0+cu126
731
+ - Accelerate: 1.6.0
732
+ - Datasets: 3.6.0
733
+ - Tokenizers: 0.21.1
734
+
735
+ ## Citation
736
+
737
+ ### BibTeX
738
+
739
+ #### Sentence Transformers
740
+ ```bibtex
741
+ @inproceedings{reimers-2019-sentence-bert,
742
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
743
+ author = "Reimers, Nils and Gurevych, Iryna",
744
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
745
+ month = "11",
746
+ year = "2019",
747
+ publisher = "Association for Computational Linguistics",
748
+ url = "https://arxiv.org/abs/1908.10084",
749
+ }
750
+ ```
751
+
752
+ #### TripletLoss
753
+ ```bibtex
754
+ @misc{hermans2017defense,
755
+ title={In Defense of the Triplet Loss for Person Re-Identification},
756
+ author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
757
+ year={2017},
758
+ eprint={1703.07737},
759
+ archivePrefix={arXiv},
760
+ primaryClass={cs.CV}
761
+ }
762
+ ```
763
+
764
+ <!--
765
+ ## Glossary
766
+
767
+ *Clearly define terms in order to be accessible across audiences.*
768
+ -->
769
+
770
+ <!--
771
+ ## Model Card Authors
772
+
773
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
774
+ -->
775
+
776
+ <!--
777
+ ## Model Card Contact
778
+
779
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
780
+ -->
config.json ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "BertModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "classifier_dropout": null,
7
+ "gradient_checkpointing": false,
8
+ "hidden_act": "gelu",
9
+ "hidden_dropout_prob": 0.1,
10
+ "hidden_size": 384,
11
+ "initializer_range": 0.02,
12
+ "intermediate_size": 1536,
13
+ "layer_norm_eps": 1e-12,
14
+ "max_position_embeddings": 512,
15
+ "model_type": "bert",
16
+ "num_attention_heads": 12,
17
+ "num_hidden_layers": 12,
18
+ "pad_token_id": 0,
19
+ "position_embedding_type": "absolute",
20
+ "torch_dtype": "float32",
21
+ "transformers_version": "4.51.3",
22
+ "type_vocab_size": 2,
23
+ "use_cache": true,
24
+ "vocab_size": 250037
25
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "4.1.0",
4
+ "transformers": "4.51.3",
5
+ "pytorch": "2.7.0+cu126"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ad78cb66f80324bd2e693982d9d3c93f2757162c1bc2692d67b9a82876a24046
3
+ size 470637416
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": false,
46
+ "cls_token": "<s>",
47
+ "do_lower_case": true,
48
+ "eos_token": "</s>",
49
+ "extra_special_tokens": {},
50
+ "mask_token": "<mask>",
51
+ "max_length": 128,
52
+ "model_max_length": 512,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "<pad>",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "</s>",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "<unk>"
65
+ }
unigram.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:da145b5e7700ae40f16691ec32a0b1fdc1ee3298db22a31ea55f57a966c4a65d
3
+ size 14763260