有关输入拆分计算的问题 #2284
有关输入拆分计算的问题
#2284
Replies: 2 comments 2 replies
-
我的理解是,拆分是为了在长文本和短文本一起推理时,为了缩短短文本的prefil阶段的时间进行的 不是这个作用吗?
…---- 回复的原邮件 ----
| 发件人 | Li ***@***.***> |
| 日期 | 2024年08月12日 23:40 |
| 收件人 | ***@***.***> |
| 抄送至 | ***@***.***>***@***.***> |
| 主题 | Re: [InternLM/lmdeploy] 有关输入拆分计算的问题 (Discussion #2284) |
需要拆分的都是一次 forward 跑不完的,不会出现一次 forward 有两个请求要拆分的情况
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
最近在学习LMDeploy v0.5.1 的代码,发现LlamaBatch的Initialize函数中有一段如下
这里是表示 partial 的 seq 只能有一个吗
Beta Was this translation helpful? Give feedback.
All reactions