SentenceTransformer based on jinaai/jina-embeddings-v5-text-small-retrieval

This is a sentence-transformers model finetuned from jinaai/jina-embeddings-v5-text-small-retrieval. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'Qwen3Model'})
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': True, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("SalahAbdoNLP/jina-v5-small-arabic-dict-v2-lora")
# Run inference
queries = [
    "Query: \u0634\u064e\u064a\u0652\u0621 \u0645\u064f\u0633\u0652\u062a\u064e\u0642\u0650\u0644\u0651",
]
documents = [
    'Document: # (1) منفردًا؛ بمَعْزِل to live apart\n(2) على حدة Each argument was considered apart .\n(3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]\n(4) بعيدًا بعضهم عن بعض Keep the children apart .\n(5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]\n(6) مستقلّ؛ منفصل a class apart .\nto know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.\n\n## المورد الحديث (2008)\nEN: apart\n\n(1) منفردًا؛ بمَعْزِل to live apart\n(2) على حدة Each argument was considered apart .\n(3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]\n(4) بعيدًا بعضهم عن بعض Keep the children apart .\n(5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]\n(6) مستقلّ؛ منفصل a class apart .\nto know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.\n',
    'Document: # قرار فرديّ (جذر: قر)\n\n## المعجم الموحد لمصطلحات القانون (2017)\nEN: individual act\n',
    'Document: # كائِنٌ حَيّ (جذر: كن)\n\n## The Unified Medical Dictionary\n*المعجم الطبي الموحد (2009)*\nEN: bion\n\n## Civil Engineering\n*المعجم الموحد لمصطلحات الهندسة المدنية (2012)*\nEN: organism\n\n## Climate, Environment and Solid Waste management\n*مسرد المناخ والبيئة وإدارة النفايات الصلبة، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)*\nEN: organism\n\nشكل من أشكال الحياة: نبات أو حيوان أو فطريات أو بكتيريا.\n\n## Climate, Environment and Solid Waste management\n*مسرد المناخ والبيئة وإدارة النفايات الصلبة، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)*\nEN: organism\n\nنبات أو حيوان أو كائن وحيد الخلية أو أي شكل من أشكال الحياة، منظومة لها مكونات مترابطة ومتكاملة تمكن من تحقيق الاستمرارية عن طريق النمو والتكاتر.\n',
]
query_embeddings = model.encode_query(queries)
document_embeddings = model.encode_document(documents)
print(query_embeddings.shape, document_embeddings.shape)
# [1, 1024] [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(query_embeddings, document_embeddings)
print(similarities)
# tensor([[0.2771, 0.2426, 0.2898]], dtype=torch.float16)

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.0357
cosine_accuracy@3 0.0357
cosine_accuracy@5 0.0357
cosine_accuracy@10 0.0357
cosine_precision@1 0.0357
cosine_precision@3 0.0119
cosine_precision@5 0.0071
cosine_precision@10 0.0036
cosine_recall@1 0.0357
cosine_recall@3 0.0357
cosine_recall@5 0.0357
cosine_recall@10 0.0357
cosine_ndcg@10 0.0357
cosine_mrr@10 0.0357
cosine_map@100 0.0369

Training Details

Training Dataset

Unnamed Dataset

  • Size: 13,980 training samples
  • Columns: anchor, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    anchor positive negative
    type string string string
    details
    • min: 8 tokens
    • mean: 30.24 tokens
    • max: 56 tokens
    • min: 42 tokens
    • mean: 344.22 tokens
    • max: 512 tokens
    • min: 26 tokens
    • mean: 130.41 tokens
    • max: 512 tokens
  • Samples:
    anchor positive negative
    Query: كَيْنُونَة كِيَان — ما يُدرَك أو يُعرَف أو يُستدَلّ على وجوده المستقل، سواء أكان حيًّا أم غير حيّ Document: # كيان (جذر: كن)

    ## Data and AI Glossary
    معجم البيانات والذكاء الاصطناعي (2024)
    EN: Entity

    شيء مادي أو غير مادي يمكن التعرُّف عليه وتمييزه بوضوح.

    ## Dictionary of Information Technology Terms
    معجم مصطلحات المعلوماتية (2000)
    EN: entity

    في التصميم بمعونة الحاسوب والتصميم الغرضي التوجه: بندٌ يمكِن أن يعامَلَ كوحدة مستقلة، وغالباً كعضو من نوع أو صنف معيَّن.

    ## Education
    مسرد التربية، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    شيء أو حدث يخزن عنه بيان في قاعدة البيانات.

    ## Philosophy and Psychology
    مسرد الفلسفة وعلم النفس، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## Sociology and Anthropology
    مسرد علم الاجتماع والأنثروبولوجيا، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## The Unified Medical Dictionary
    المعجم الطبي الموحد (2009)
    EN: entity

    ## معجم المصطلحات الطبية (ج.2، 2003)
    معجم المصطلحات الطبية (ج.2، 2003)
    EN: entity

    حقيقة الشيء أو وجوده المستقل.

    ## Ahmad Mukhtar Umar, Muʿjam ...
    Document: # (1) كينونة؛ وجود
    (2) الكائنات مجتمعةً
    (3) كائن
    (4) حياة؛ بقاء struggle for existence
    (5) أسلوبُ حياةٍ.


    ## Al-Mawrid Al-Hadeeth
    المورد الحديث (2008)
    EN: existence

    (1) كينونة؛ وجود
    (2) الكائنات مجتمعةً
    (3) كائن
    (4) حياة؛ بقاء struggle for existence
    (5) أسلوبُ حياةٍ.
    Query: كَيْنُونَة كِيَان Document: # كيان (جذر: كن)

    ## Data and AI Glossary
    معجم البيانات والذكاء الاصطناعي (2024)
    EN: Entity

    شيء مادي أو غير مادي يمكن التعرُّف عليه وتمييزه بوضوح.

    ## Dictionary of Information Technology Terms
    معجم مصطلحات المعلوماتية (2000)
    EN: entity

    في التصميم بمعونة الحاسوب والتصميم الغرضي التوجه: بندٌ يمكِن أن يعامَلَ كوحدة مستقلة، وغالباً كعضو من نوع أو صنف معيَّن.

    ## Education
    مسرد التربية، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    شيء أو حدث يخزن عنه بيان في قاعدة البيانات.

    ## Philosophy and Psychology
    مسرد الفلسفة وعلم النفس، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## Sociology and Anthropology
    مسرد علم الاجتماع والأنثروبولوجيا، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## The Unified Medical Dictionary
    المعجم الطبي الموحد (2009)
    EN: entity

    ## معجم المصطلحات الطبية (ج.2، 2003)
    معجم المصطلحات الطبية (ج.2، 2003)
    EN: entity

    حقيقة الشيء أو وجوده المستقل.

    ## Ahmad Mukhtar Umar, Muʿjam ...
    Document: # (1) كينونة؛ وجود
    (2) الكائنات مجتمعةً
    (3) كائن
    (4) حياة؛ بقاء struggle for existence
    (5) أسلوبُ حياةٍ.


    ## Al-Mawrid Al-Hadeeth
    المورد الحديث (2008)
    EN: existence

    (1) كينونة؛ وجود
    (2) الكائنات مجتمعةً
    (3) كائن
    (4) حياة؛ بقاء struggle for existence
    (5) أسلوبُ حياةٍ.
    Query: ما يُدرَك أو يُعرَف أو يُستدَلّ على وجوده المستقل، سواء أكان حيًّا أم غير حيّ Document: # كيان (جذر: كن)

    ## Data and AI Glossary
    معجم البيانات والذكاء الاصطناعي (2024)
    EN: Entity

    شيء مادي أو غير مادي يمكن التعرُّف عليه وتمييزه بوضوح.

    ## Dictionary of Information Technology Terms
    معجم مصطلحات المعلوماتية (2000)
    EN: entity

    في التصميم بمعونة الحاسوب والتصميم الغرضي التوجه: بندٌ يمكِن أن يعامَلَ كوحدة مستقلة، وغالباً كعضو من نوع أو صنف معيَّن.

    ## Education
    مسرد التربية، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    شيء أو حدث يخزن عنه بيان في قاعدة البيانات.

    ## Philosophy and Psychology
    مسرد الفلسفة وعلم النفس، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## Sociology and Anthropology
    مسرد علم الاجتماع والأنثروبولوجيا، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## The Unified Medical Dictionary
    المعجم الطبي الموحد (2009)
    EN: entity

    ## معجم المصطلحات الطبية (ج.2، 2003)
    معجم المصطلحات الطبية (ج.2، 2003)
    EN: entity

    حقيقة الشيء أو وجوده المستقل.

    ## Ahmad Mukhtar Umar, Muʿjam ...
    Document: # (1) كينونة؛ وجود
    (2) الكائنات مجتمعةً
    (3) كائن
    (4) حياة؛ بقاء struggle for existence
    (5) أسلوبُ حياةٍ.


    ## Al-Mawrid Al-Hadeeth
    المورد الحديث (2008)
    EN: existence

    (1) كينونة؛ وجود
    (2) الكائنات مجتمعةً
    (3) كائن
    (4) حياة؛ بقاء struggle for existence
    (5) أسلوبُ حياةٍ.
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "CachedMultipleNegativesRankingLoss",
        "matryoshka_dims": [
            1024,
            768,
            512,
            256,
            128,
            64,
            32
        ],
        "matryoshka_weights": [
            1.0,
            1.0,
            1.0,
            1.0,
            1.0,
            1.0,
            1.0
        ],
        "n_dims_per_step": -1
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 4,536 evaluation samples
  • Columns: anchor, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    anchor positive negative
    type string string string
    details
    • min: 15 tokens
    • mean: 29.28 tokens
    • max: 60 tokens
    • min: 49 tokens
    • mean: 283.27 tokens
    • max: 512 tokens
    • min: 29 tokens
    • mean: 131.25 tokens
    • max: 512 tokens
  • Samples:
    anchor positive negative
    Query: شَيْء مُسْتَقِلّ — كيان مستقلّ قائم بذاته ومنفصل عن غيره Document: # (1) منفردًا؛ بمَعْزِل to live apart
    (2) على حدة Each argument was considered apart .
    (3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]
    (4) بعيدًا بعضهم عن بعض Keep the children apart .
    (5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]
    (6) مستقلّ؛ منفصل a class apart .
    to know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.

    ## المورد الحديث (2008)
    EN: apart

    (1) منفردًا؛ بمَعْزِل to live apart
    (2) على حدة Each argument was considered apart .
    (3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]
    (4) بعيدًا بعضهم عن بعض Keep the children apart .
    (5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]
    (6) مستقلّ؛ منفصل a class apart .
    to know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.
    Document: # كيان (جذر: كن)

    ## مسرد التربية، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    شيء أو حدث يخزن عنه بيان في قاعدة البيانات.

    ## مسرد علم الاجتماع والأنثروبولوجيا، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## مسرد الفلسفة وعلم النفس، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## معجم مصطلحات المعلوماتية (2000)
    EN: entity

    في التصميم بمعونة الحاسوب والتصميم الغرضي التوجه: بندٌ يمكِن أن يعامَلَ كوحدة مستقلة، وغالباً كعضو من نوع أو صنف معيَّن.

    ## المعجم الطبي الموحد (2009)
    EN: entity

    ## معجم البيانات والذكاء الاصطناعي (2024)
    EN: Entity

    شيء مادي أو غير مادي يمكن التعرُّف عليه وتمييزه بوضوح.

    ## معجم المصطلحات الطبية (ج.2، 2003)
    EN: entity

    حقيقة الشيء أو وجوده المستقل.
    Query: شَيْء مُسْتَقِلّ Document: # (1) منفردًا؛ بمَعْزِل to live apart
    (2) على حدة Each argument was considered apart .
    (3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]
    (4) بعيدًا بعضهم عن بعض Keep the children apart .
    (5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]
    (6) مستقلّ؛ منفصل a class apart .
    to know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.

    ## المورد الحديث (2008)
    EN: apart

    (1) منفردًا؛ بمَعْزِل to live apart
    (2) على حدة Each argument was considered apart .
    (3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]
    (4) بعيدًا بعضهم عن بعض Keep the children apart .
    (5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]
    (6) مستقلّ؛ منفصل a class apart .
    to know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.
    Document: # كيان (جذر: كن)

    ## مسرد التربية، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    شيء أو حدث يخزن عنه بيان في قاعدة البيانات.

    ## مسرد علم الاجتماع والأنثروبولوجيا، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## مسرد الفلسفة وعلم النفس، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## معجم مصطلحات المعلوماتية (2000)
    EN: entity

    في التصميم بمعونة الحاسوب والتصميم الغرضي التوجه: بندٌ يمكِن أن يعامَلَ كوحدة مستقلة، وغالباً كعضو من نوع أو صنف معيَّن.

    ## المعجم الطبي الموحد (2009)
    EN: entity

    ## معجم البيانات والذكاء الاصطناعي (2024)
    EN: Entity

    شيء مادي أو غير مادي يمكن التعرُّف عليه وتمييزه بوضوح.

    ## معجم المصطلحات الطبية (ج.2، 2003)
    EN: entity

    حقيقة الشيء أو وجوده المستقل.
    Query: كيان مستقلّ قائم بذاته ومنفصل عن غيره Document: # (1) منفردًا؛ بمَعْزِل to live apart
    (2) على حدة Each argument was considered apart .
    (3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]
    (4) بعيدًا بعضهم عن بعض Keep the children apart .
    (5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]
    (6) مستقلّ؛ منفصل a class apart .
    to know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.

    ## المورد الحديث (2008)
    EN: apart

    (1) منفردًا؛ بمَعْزِل to live apart
    (2) على حدة Each argument was considered apart .
    (3) جانبًا [كقولك: joking apart أي: إذا وضعنا المُزاح جانبًا وتكلّمنا جدّيًّا]
    (4) بعيدًا بعضهم عن بعض Keep the children apart .
    (5) إلى أجزاء [كقولك to take a watch apart أي يفكِّك ساعة]
    (6) مستقلّ؛ منفصل a class apart .
    to know (or tell) apart : يميّز بين شيء وآخر.worlds apart : مختلف جدًا.
    Document: # كيان (جذر: كن)

    ## مسرد التربية، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    شيء أو حدث يخزن عنه بيان في قاعدة البيانات.

    ## مسرد علم الاجتماع والأنثروبولوجيا، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## مسرد الفلسفة وعلم النفس، المنظمة العربية للتربية والثقافة والعلوم (موقع ArabTerm)
    EN: entity

    ## معجم مصطلحات المعلوماتية (2000)
    EN: entity

    في التصميم بمعونة الحاسوب والتصميم الغرضي التوجه: بندٌ يمكِن أن يعامَلَ كوحدة مستقلة، وغالباً كعضو من نوع أو صنف معيَّن.

    ## المعجم الطبي الموحد (2009)
    EN: entity

    ## معجم البيانات والذكاء الاصطناعي (2024)
    EN: Entity

    شيء مادي أو غير مادي يمكن التعرُّف عليه وتمييزه بوضوح.

    ## معجم المصطلحات الطبية (ج.2، 2003)
    EN: entity

    حقيقة الشيء أو وجوده المستقل.
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "CachedMultipleNegativesRankingLoss",
        "matryoshka_dims": [
            1024,
            768,
            512,
            256,
            128,
            64,
            32
        ],
        "matryoshka_weights": [
            1.0,
            1.0,
            1.0,
            1.0,
            1.0,
            1.0,
            1.0
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • num_train_epochs: 2
  • learning_rate: 2e-05
  • lr_scheduler_type: cosine
  • warmup_steps: 0.1
  • eval_strategy: epoch
  • push_to_hub: True
  • hub_model_id: SalahAbdoNLP/jina-v5-small-arabic-dict-v2-lora
  • load_best_model_at_end: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • per_device_train_batch_size: 8
  • num_train_epochs: 2
  • max_steps: -1
  • learning_rate: 2e-05
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: None
  • warmup_steps: 0.1
  • optim: adamw_torch_fused
  • optim_args: None
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • optim_target_modules: None
  • gradient_accumulation_steps: 1
  • average_tokens_across_devices: True
  • max_grad_norm: 1.0
  • label_smoothing_factor: 0.0
  • bf16: False
  • fp16: False
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • use_liger_kernel: False
  • liger_kernel_config: None
  • use_cache: False
  • neftune_noise_alpha: None
  • torch_empty_cache_steps: None
  • auto_find_batch_size: False
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • include_num_input_tokens_seen: no
  • log_level: passive
  • log_level_replica: warning
  • disable_tqdm: False
  • project: huggingface
  • trackio_space_id: trackio
  • eval_strategy: epoch
  • per_device_eval_batch_size: 8
  • prediction_loss_only: True
  • eval_on_start: False
  • eval_do_concat_batches: True
  • eval_use_gather_object: False
  • eval_accumulation_steps: None
  • include_for_metrics: []
  • batch_eval_metrics: False
  • save_only_model: False
  • save_on_each_node: False
  • enable_jit_checkpoint: False
  • push_to_hub: True
  • hub_private_repo: None
  • hub_model_id: SalahAbdoNLP/jina-v5-small-arabic-dict-v2-lora
  • hub_strategy: every_save
  • hub_always_push: False
  • hub_revision: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • restore_callback_states_from_checkpoint: False
  • full_determinism: False
  • seed: 42
  • data_seed: None
  • use_cpu: False
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • dataloader_prefetch_factor: None
  • remove_unused_columns: True
  • label_names: None
  • train_sampling_strategy: random
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • ddp_backend: None
  • ddp_timeout: 1800
  • fsdp: []
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • deepspeed: None
  • debug: []
  • skip_memory_metrics: True
  • do_predict: False
  • resume_from_checkpoint: None
  • warmup_ratio: None
  • local_rank: -1
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss Validation Loss jina-v5-small-eval_cosine_ndcg@10
0.0229 20 9.2318 - -
0.0458 40 7.1873 - -
0.0686 60 3.9691 - -
0.0915 80 1.8627 - -
0.1144 100 1.9487 - -
0.1373 120 1.2300 - -
0.1602 140 1.8359 - -
0.1831 160 2.2169 - -
0.2059 180 3.8115 - -
0.2288 200 4.0140 - -
0.2517 220 4.9125 - -
0.2746 240 7.1376 - -
0.2975 260 9.3695 - -
0.3204 280 10.6953 - -
0.3432 300 17.7582 - -
0.3661 320 24.4672 - -
0.3890 340 0.0 - -
0.4119 360 0.0 - -
0.4348 380 0.0 - -
0.4577 400 0.0 - -
0.4805 420 0.0 - -
0.5034 440 0.0 - -
0.5263 460 0.0 - -
0.5492 480 0.0 - -
0.5721 500 0.0 - -
0.5950 520 0.0 - -
0.6178 540 0.0 - -
0.6407 560 0.0 - -
0.6636 580 0.0 - -
0.6865 600 0.0 - -
0.7094 620 0.0 - -
0.7323 640 0.0 - -
0.7551 660 0.0 - -
0.7780 680 0.0 - -
0.8009 700 0.0 - -
0.8238 720 0.0 - -
0.8467 740 0.0 - -
0.8696 760 0.0 - -
0.8924 780 0.0 - -
0.9153 800 0.0 - -
0.9382 820 0.0 - -
0.9611 840 0.0 - -
0.9840 860 0.0 - -
1.0 874 - nan 0.0357
1.0069 880 0.0 - -
1.0297 900 0.0 - -
1.0526 920 0.0 - -
1.0755 940 0.0 - -
1.0984 960 0.0 - -
1.1213 980 0.0 - -
1.1442 1000 0.0 - -
1.1670 1020 0.0 - -
1.1899 1040 0.0 - -
1.2128 1060 0.0 - -
1.2357 1080 0.0 - -
1.2586 1100 0.0 - -
1.2815 1120 0.0 - -
1.3043 1140 0.0 - -
1.3272 1160 0.0 - -
1.3501 1180 0.0 - -
1.3730 1200 0.0 - -
1.3959 1220 0.0 - -
1.4188 1240 0.0 - -
1.4416 1260 0.0 - -
1.4645 1280 0.0 - -
1.4874 1300 0.0 - -
1.5103 1320 0.0 - -
1.5332 1340 0.0 - -
1.5561 1360 0.0 - -
1.5789 1380 0.0 - -
1.6018 1400 0.0 - -
1.6247 1420 0.0 - -
1.6476 1440 0.0 - -
1.6705 1460 0.0 - -
1.6934 1480 0.0 - -
1.7162 1500 0.0 - -
1.7391 1520 0.0 - -
1.7620 1540 0.0 - -
1.7849 1560 0.0 - -
1.8078 1580 0.0 - -
1.8307 1600 0.0 - -
1.8535 1620 0.0 - -
1.8764 1640 0.0 - -
1.8993 1660 0.0 - -
1.9222 1680 0.0 - -
1.9451 1700 0.0 - -
1.9680 1720 0.0 - -
1.9908 1740 0.0 - -
2.0 1748 - nan 0.0357
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.12.12
  • Sentence Transformers: 5.3.0
  • Transformers: 5.2.0
  • PyTorch: 2.9.0+cu126
  • Accelerate: 1.12.0
  • Datasets: 4.7.0
  • Tokenizers: 0.22.2

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

CachedMultipleNegativesRankingLoss

@misc{gao2021scaling,
    title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
    author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
    year={2021},
    eprint={2101.06983},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for SalahAbdoNLP/jina-v5-small-arabic-dict-v2-lora

Papers for SalahAbdoNLP/jina-v5-small-arabic-dict-v2-lora

Evaluation results