周博洋+ai

2024-12-03 05:13:37

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

周博洋的想法: Voice engine今后可以独立于gpt4使用了,专注于tts...

Voice engine今后可以独立于gpt4使用了,专注于tts,和whisper的asr正好互为逆向,给市场上做T2A的又来了一次打击,因为它支持语种太宽泛了,还有最一个可怕的点是大概是它训练时候有gpt的nlp加持吧,我分析的,这块也没论文,也没证据,毕竟是closeai,所以对什么化学,生物,核物理,金融这些特定领域东西都有概念,所以读出来...
周博洋 - 知乎

MS做AI的高新科技微软(Microsoft) 架构师查看详细资料关注他发私信动态回答73 视频1 提问0 文章106 专栏0 想法225 收藏1 关注订阅他的动态还没有动态认证与成就认证信息微软(中国)有限公司员工获得1,148 次赞同获得1,064 次喜欢,2,834 次收藏 ...
神神叨叨的OpenAI和神神叨叨的草莓_周博洋的Gen AI小课堂的技术...

所以Schlman他们对齐组的,就要从RLHF上下功夫,诞生了Q*和草莓这些相对玩的很新的RL算法来提升模型的能力,当然最终目标都是AGI,可是AGI如果面对的全是幻觉,它必然不是AGI,我可以给出结论,Q*和草莓,不是AGI路上的唯一需要解决问题的办法,但肯定是必要的那个。我们知道传统的模型训练,包括Pratrain,Finetune,RLHF...
用ColossalAI完成一次完整的预训练_周博洋的Gen AI小课堂的技术...

warnings.warn(incompatible_device_warn.format(device_name, capability, " ".join(arch_list), device_name)) /aml/colo/lib/python3.10/site-packages/colossalai/kernel/cuda_native/mha/flash_attn_2.py:28: UserWarning: please install flash_attn from https://github.com/HazyResearch/flash-attention wa...
周博洋K-站长博客圈

原创 AI与电力从另一个角度看这个事,10万台H100,就是70M瓦, 刚才我们聊过,类似纽约这种,它的能力大概是10几个G瓦,70M瓦其实还好,如果是缓慢增长,电网未必能干断,但是怕就怕在AI的业务形态,主要是训练这块,都是突然就曝起,然后突然就下降,因为同一时刻计算和存储只能干一个事,计算的时候总耗电量刷就上去...
...tuning工程化的地位和意义_周博洋的Gen AI小课堂的技术博客...

prompt-engineering,RAG,fine-tuning,这几个东西各自有各自的用途和场景,也能混用,但是不能平行着用,读完了我这篇文章,相信读者们应该很好的理解了他们的各司其职,最好的方法肯定还是混着用比如Scale AI他们就给出过几种能力叠加以后的准确率相关性本文完...
让Ilya都感到害怕的AGI是由什么东西创造出来的?_周博洋的Gen AI小...

在他之前,几乎没有人研究这项东西,他甚至不惜要把OpenAI整个算力的百分之20要拿来研究这些,(OpenAI断网跟他有关系)归根结底就是他希望AI要绝对的可控。由于人家成天和数据,训练方法,推理,算力打交道,所以可以笃定,他一定是看到了我们局外人,甚至大多数OpenAI员工都没看到的甚至有点恐怖的东西......
LLM 参数,显存,Tflops? 训练篇(5)_周博洋的Gen AI小课堂的技术...

整体的分布如上图所示,所以在训练的过程中,一个模型参数需要占用16bytes的内存。除了第一项,其他后5项严格来说都不能算是静态占用。除了训练时load的以上各种参数相关的权重以外,最终要的是输入模型进行训练的token的batchsize长度和单个训练的seq_number,这两个值会直接影响到我到底要load多少数据,这部分数据会...
多模态MLLM都是怎么实现的(1)_周博洋的Gen AI小课堂的技术博客...

1-Encoder,decoder的多模 2-多模融合我们从一个简单的多模态CLIP讲起 CLIP也是OPENAI的模型,现在也被广泛的应用于各种多模态的业务场景里,本身是开源的,又是挺重要的分类器,你们使用的多模态模型或多或少都用了它的代码和概念我们先看它是怎么实现的,看下图 ...
GPT4o Realtime voice功能的复现路径_周博洋的Gen AI小课堂的技术...

我之前讲过草莓,后面会随着我深度学习的课程继续讲的更细,因为GPT4o最亮眼的实时语音功能上线了,大家对这个特别感兴趣,所以我就讲一下,但是因为Close AI众所周知的缘故,我就按着类似功能的论文讲了,只是从延迟能力上讲,这个是实现最接近的。老规矩,论文地址: ...

缩写

英文翻译

上海网友集中晒蘑菇

快搜

周博洋+ai

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

周博洋的想法: Voice engine今后可以独立于gpt4使用了,专注于tts...

周博洋 - 知乎

神神叨叨的OpenAI和神神叨叨的草莓_周博洋的Gen AI小课堂的技术...

用ColossalAI完成一次完整的预训练_周博洋的Gen AI小课堂的技术...

周博洋K-站长博客圈

...tuning工程化的地位和意义_周博洋的Gen AI小课堂的技术博客...

让Ilya都感到害怕的AGI是由什么东西创造出来的?_周博洋的Gen AI小...

LLM 参数,显存,Tflops? 训练篇(5)_周博洋的Gen AI小课堂的技术...

多模态MLLM都是怎么实现的(1)_周博洋的Gen AI小课堂的技术博客...

GPT4o Realtime voice功能的复现路径_周博洋的Gen AI小课堂的技术...

缩写

英文翻译

近反义词

相关词语

相关搜索

快搜

周博洋+ai

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

周博洋 的想法: Voice engine今后可以独立于gpt4使用了,专注于tts...

周博洋 - 知乎

神神叨叨的OpenAI和神神叨叨的草莓_周博洋的Gen AI小课堂的技术...

用ColossalAI完成一次完整的预训练_周博洋的Gen AI小课堂的技术...

周博洋K-站长博客圈

...tuning工程化的地位和意义_周博洋的Gen AI小课堂的技术博客...

让Ilya都感到害怕的AGI是由什么东西创造出来的?_周博洋的Gen AI小...

LLM 参数,显存,Tflops? 训练篇(5)_周博洋的Gen AI小课堂的技术...

多模态MLLM都是怎么实现的(1)_周博洋的Gen AI小课堂的技术博客...

GPT4o Realtime voice功能的复现路径_周博洋的Gen AI小课堂的技术...

缩写

英文翻译

近反义词

相关词语

相关搜索

周博洋的想法: Voice engine今后可以独立于gpt4使用了,专注于tts...