causal_lm_cpp

[ Speculative decoding ] Support different tokenizers for draft and main models #7232

Sign in to view logs

Triggered via pull request January 23, 2025 10:12

iefode

synchronize #1617

iefode:different_tokenizers

Status Success

Total duration 37m 14s

Artifacts –

causal_lm_cpp.yml

on: pull_request

Matrix: cpp-beam_search_causal_lm-ubuntu

cpp-multinomial-greedy_causal_lm-ubuntu

cpp-greedy_causal_lm-windows

cpp-greedy_causal_lm-Qwen-7B-Chat

cpp-beam_search_causal_lm-Qwen1_5-7B-Chat

cpp-beam_search_causal_lm-Phi-2

cpp-beam_search_causal_lm-notus-7b-v1

cpp-speculative_decoding_lm-ubuntu

cpp-prompt_lookup_decoding_lm-ubuntu

cpp-greedy_causal_lm-redpajama-3b-chat

cpp-chat_sample-ubuntu

visual_language_chat_sample-ubuntu-minicpm_v2_6

visual_language_chat_sample-ubuntu-llava_1_5 / visual_language_chat_sample-ubuntu-llava

visual_language_chat_sample-ubuntu-llava_next / visual_language_chat_sample-ubuntu-llava

visual_language_chat_sample-ubuntu-internvl2

cpp-continuous-batching-ubuntu

cpp-continuous-batching-windows

cpp-continuous-batching-macos

visual_language_chat_sample-ubuntu-qwen2vl

ci/gha_overall_status_causal_lm

Annotations

1 warning

ci/gha_overall_status_causal_lm

ubuntu-latest pipelines will use ubuntu-24.04 soon. For more details, see https://github.com/actions/runner-images/issues/10636