美国宾夕法尼亚州立大学近日发布了一项颠覆性研究:通过AI与毫米波雷达传感器的组合,可在3米范围内将手机通话内容转录为文本,准确率高达60%。这项技术利用了毫米波雷达的高精度感知能力,结合AI的强大数据处理能力,实现了对语音信号的精准捕捉和转换。不仅如此,该技术未来还可能应用于智能助手、实时字幕生成等多个领域。然而,这项技术突破看似惊人,却也如同一把双刃剑,在为未来智能感知带来无限可能的同时,更向公众隐私安全敲响了警钟。

研究团队利用毫米波雷达传感器探测手机在通话时产生的微小振动。当语音通过耳机播放时,手机表面会出现人眼难以察觉的微米级位移。雷达精准捕捉这些振动信号后,将其输入开源语音识别模型Whisper。针对雷达信号质量较低、噪音大的特点,团队采用“低秩适应”方法,仅微调模型1%的参数,使其高效识别雷达数据。最终,系统可将通话转录为文本,词汇量覆盖一万词,准确率60%。尽管存在误差,但结合语境分析仍能推断出关键词与核心内容。
页码:下一页