AI 周刊 #001 · GPT-4o 登场，多模态时代正式开启

每周精选 AI 领域最值得关注的进展、论文与工具。

本周焦点

OpenAI 发布了新一代多模态旗舰模型 GPT-4o，支持实时语音、图像与文本的混合输入输出。推理速度相比 GPT-4 Turbo 提升 2x，成本降低 50%。

值得关注的几个细节：

Meta 发布 Llama 3（8B / 70B），在多个 benchmark 上超越同量级闭源模型，8B 版本在 MMLU 上达到 68.4%。

论文	核心贡献
KV Cache Quantization	将 KV Cache 压缩至 2bit，长上下文推理节省 70% 显存
LoRA+	自适应学习率的 LoRA 变体，微调效果提升 2%

Google I/O 将于下周召开，Gemini 1.5 Pro 正式版和 Project Astra 值得重点关注。