科大讯飞智能体耳机 Air 发售:一键录音转文字、支持 AI 翻译,1051 元
科大讯飞Air耳机一键录音转文字并支持AI翻译,商务会议神器,续航53小时无忧。
IT之家 5 月 22 日消息,科大讯飞旗下智能体耳机 Air 现已在京东发售,该机主要用于商务场合,主打“一键录音转文字”, 定价为 1051 元 ,部分地区国补后到手价 899 元。 该耳机提供冰灰色、雾灰色两种配色可选,采用开放式设计,采用亲肤液态硅胶材质,可实现“一触即录”,适合通话录音、会…
科大讯飞Air耳机一键录音转文字并支持AI翻译,商务会议神器,续航53小时无忧。
IT之家 5 月 22 日消息,科大讯飞旗下智能体耳机 Air 现已在京东发售,该机主要用于商务场合,主打“一键录音转文字”, 定价为 1051 元 ,部分地区国补后到手价 899 元。 该耳机提供冰灰色、雾灰色两种配色可选,采用开放式设计,采用亲肤液态硅胶材质,可实现“一触即录”,适合通话录音、会…
腾讯会议AI同传上线,能模仿你的音色且时延低于3秒,让每个人独立收听自己的语言,发言翻译几乎同步。
IT之家 5 月 21 日消息,腾讯会议今日宣布「AI 同传」正式上线,可模仿用户音色、时延低于 3 秒,发言和翻译几乎同步。 据介绍,该功能不用插件、不用外接设备,会议里的每一位参会者, 都能独立开启属于自己的「AI 同传」 ,你听你想听的语言,他听他想听的语言,每个人的发言都被清晰对应、精准传递…
腾讯混元开源Hy-MT2翻译模型,同步上线「腾讯Hy翻译」小程序,邀你参加WMT26比赛赢取特设奖励。
最大提升体现在指令遵循能力上
谷歌Gemini AI助手,多模态交互支持实时翻译、语音导航,免费使用且可整合到智能眼镜实现免手操作。
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌携手三星公司, 展示了由 Gentle Monster 与 Warby Parker 共同参与设计的 2 款智能眼镜。 定位方面,两款智能眼镜作为手机的伴侣设备存在,重点整合 Gemini AI 模型,提供抬头可用、…
脑电信号直接转文字?RAG+大模型解码思维的新方法,IEEE论文干货满满
arXiv:2605.17503v1 Announce Type: cross Abstract: The decoding of linguistic information from electroencephalography (EEG) signals remains an extremel…
面向古籍翻译难题,提出古希腊语到现代希腊语的专用基准,对比LLM与NMT模型的微调效果。
arXiv:2605.18504v1 Announce Type: new Abstract: Machine Translation (MT) for Ancient Greek (AG) to Modern Greek (MG) is a low-resource task, constrain…
一篇证明域迁移通过单一对齐可变得可识别的理论论文,解决内容混淆难题
arXiv:2605.17918v1 Announce Type: new Abstract: Domain transfer (DT) maps source to target distributions and supports tasks such as unsupervised image…
实时本地OCR翻译Hoyoverse游戏内对话,GPU加速,精准匹配无延迟,开源免费。
Article URL: https://github.com/wojciechowskiapp/Kaption Comments URL: https://news.ycombinator.com/item?id=48181500 Points: 1 # Comments: 0
PDF翻译新突破!ForMaT数据集保留原文布局,支持15种语言对,精准处理嵌套表格等复杂结构。
arXiv:2605.15794v1 Announce Type: new Abstract: We present ForMaT (Format-Preserving Multilingual Translation), a parallel corpus of 3,956 PDFs across…
手指上的AI戒指实时翻译手语,还有望拓展VR/AR交互新场景。
Article URL: https://spectrum.ieee.org/sign-language-interpreter Comments URL: https://news.ycombinator.com/item?id=48181012 Points: 1 # Comments: 0
106本小说16种语言,130k段落揭示大模型文学翻译流畅性与忠实度间的微妙平衡
arXiv:2605.15282v1 Announce Type: new Abstract: Literary translation requires balancing target-language fluency with faithfulness to the source. Recen…
用小型开源LLM实现可解释的翻译质量评估,兼顾隐私与成本,性能媲美大模型。
arXiv:2605.15763v1 Announce Type: cross Abstract: Current state-of-the-art Quality Estimation (QE) in machine translation relies on massive, proprieta…
本地运行,实时AI字幕叠加,支持多语言翻译,免费开源,无需云服务或API密钥。
Article URL: https://github.com/MohammdKopa/kami-subs Comments URL: https://news.ycombinator.com/item?id=48170348 Points: 2 # Comments: 1
OpenAI API推出全新实时语音模型,支持推理、翻译与转录,打造更智能自然的语音交互体验。
Explore new realtime voice models in the OpenAI API that can reason, translate, and transcribe speech, enabling more natural and intelligent voice exp…
小米首款耳夹耳机真机曝光,黑白金三色加神秘配色,5.5g超轻机身、LHDC5.0+Hi-Res金标,还有智能翻译和录音摘要功能。
IT之家 5 月 16 日消息,正在进行的卢伟冰爆料直播中,小米中国区市场部总经理魏思琪晒出了小米首款耳夹耳机的真机。 IT之家注意到,视频中展示了三款配色,分别为玄武岩黑、珍珠白、缎光金,魏思琪透露还有一款神秘配色此次并未展示,将在后续预热中公布。 据此前官方介绍,小米耳夹式耳机单机重量仅 5.5…
arXiv论文页面,展示利用元步骤解码和验证器引导的代码翻译前沿研究,助力AI代码翻译质量提升。
arXiv:2605.17626v1 Announce Type: new Abstract: Test-time scaling is an important mechanism for improving large language models, especially on tasks w…