免费在线语音转文字

免费在线语音转文字。上传音频、转写录音、生成字幕，并用多种语言编辑转写结果。

历史

每天10次免费转录（音频≤30分钟）。

点击上传或拖拽文件

点击上传

支持 WMA、WAV、OGG、MP3、M4A、FLAC、AMR、AIFF，最大500MB

说话人识别

检测多个说话人并相应地分割转录。

告别手动打字

把会议、讲座、采访或语音备忘录中的长内容一点点敲出来，往往比录音本身还费时间。用在线语音转文字，你可以把说出来的内容直接变成可编辑文本，少花时间反复回放、暂停和手动输入。

保留你可能错过的细节

口语内容里常常会有很多容易遗漏的小细节，比如原话表述、人名、数字、说话人切换和上下文。如果你只靠记忆或速记，很容易漏掉重点。音频转文字工具可以给你更完整的书面版本，方便你更仔细地回看究竟说了什么。

让所有人看到同一份记录

同一段对话，不同的人往往会记成不同的版本。在真实工作里，很多讨论不只是结束后再回顾一次，而是需要在过程中不断同步、确认和留档。当语音变成文字后，所有人都能对照同一份记录，核对说过的话，澄清模糊点，减少重复跟进。

把语音变成真正可用的内容

完成转写后，这些内容就不只是记录，而是可以继续利用的资料。你可以做总结、整理成思维导图、向 AI 提问、翻译或导出结果，把更多时间花在理解内容、整理思路和决定下一步上。

实用的语音转文字功能

Decopy 提供灵活的语音转文字方式，支持查看转写、说话人识别、重点总结、AI 提问、内容翻译和多格式导出，适配不同工作流程。

多种输入来源

语音内容可以来自很多地方。你可以录制语音备忘录做 voice to text，采集实时语音，上传音频或视频，粘贴视频链接，或者把播客音频转成文字。

总结与思维导图

长篇口语内容如果只看整篇转写，往往不容易快速消化。Decopy 可以把它整理成总结、大纲和思维导图，帮助你更快抓住重点和思路关系。

就转写内容向 AI 提问

语音转文字之后，转写内容就可以作为一个聚焦的信息来源。你可以使用 AI Chat 提问、找答案、核对讨论内容，或者快速定位细节。

说话人识别

多人内容里，谁说了什么很重要。AI 语音识别可以在转写中识别不同说话人，你也可以按需重命名、添加或替换说话人标签。

转写翻译

把语音转文字结果翻译成其他语言，方便你理解原始语音、分享给他人，或为跨语言沟通准备文本。

多格式导出

当转写完成后，你可以按下一步工作需要导出对应格式。无论是文档、字幕流程、团队文件还是归档，都不必再手动复制整理。

只要有人在说话，语音转文字就能帮上忙

把口语内容变成可以回看、复用、分享或留档的文本。

团队跟进

团队讨论里经常会涉及决策、问题、责任分工和下一步动作。转写记录能让所有人看到同一份内容，而不是在会后只凭记忆去回想。

调研与采访

采访和专家对话常常是报告、分析和判断的原始素材。语音转文字能让回答、引用、案例和背景信息更容易查看和整理。

销售与客户通话

客户通话里可能包含需求、异议、偏好、预算、时间安排和承诺的后续动作。把语音转成文字后，销售和服务团队可以在下次联系前先把这些细节核对清楚。

服务细节记录

在房产、法律咨询、保险、活动执行和高端服务场景里，很多小细节都会影响最终结果。书面转写能帮助你保留口头指示、偏好和关键点，方便后续复查。

创作者内容

播客、视频、线上分享和语音灵感，在转写之后都可以变成可复用的文本。创作者可以把它用于字幕、总结、脚本、帖子或可搜索内容。

如何在线把语音转成文字

Step 1

添加语音来源并选择说话人选项

上传音频或视频文件、粘贴链接、在浏览器中录音，或者添加播客内容。如果内容里有多位说话人，请在生成转写前开启说话人识别。

Step 2

查看转写与说话人

Decopy 会在带音频播放的交互式工作区中展示转写结果。你可以核对不清晰的词句、查看说话人标签、重命名说话人、添加新说话人，或在整篇转写中统一替换说话人名称。

Step 3

借助 AI 理解内容

使用 Summary 快速抓住重点，用 Mind Map 可视化整理思路，再用 AI Chat 基于转写内容提问。这能帮助你更快处理长篇语音内容。

Step 4

翻译、导出或继续复用

你可以翻译转写内容，按所需格式导出，或者把最终文本直接带入下一步工作流程，不必再手动复制整理。

立即生成

语音转文字相关指南

你是有录音文件、音频、视频，还是只想直接用自己的声音？选择最适合你起点的页面。

语音输入转文字

了解 Voice to Text 如何帮助你把说出来的话转成书面内容。

查看语音输入技巧 →

音频转文字

如果你的口语内容已经保存成音频文件，可以查看 Audio to Text 的使用方式。

查看音频文件指南 →

MP3 转文字

MP3 是很常见的音频格式。了解 MP3 to Text 如何把 MP3 录音转换成清晰易读的转写文本。

查看 MP3 转写指南 →

你可能也需要 Text to Speech

Speech to Text 是把说出来的话变成文字。Text to Speech 则是反过来，把写好的内容转换成自然语音，适合你需要语音版本的时候使用。
如果你已经有文本，希望别人听而不是读，它会很有用。它适合配音、辅助阅读、学习音频或简单内容分享。

试试 Text to Speech

哪些因素会影响语音转文字准确率？

当语音清晰、语言设置正确、音频易于辨认时，语音转文字效果会更好。背景噪音、多人重叠发言、语速过快和专业术语都可能影响最终转写结果。

准确率检查清单

自然口语并不总是干净整齐

真实语音里常常会有停顿、重复词、语气词、没说完的句子和口语化表达。这些都会增加语音识别难度，尤其是在长对话或非正式交流里。

说得清楚，文本会更准

尽量以稳定语速说话，并让声音靠近麦克风。发音越清晰，语音识别越容易抓住关键细节。

背景噪音会让词句更难识别

音乐、回声、车流声、键盘声和环境杂音都会影响口语识别效果。更安静的音源通常会带来更干净的转写结果，也能减少后续校对工作。

多人重叠发言需要额外检查

Decopy 可以帮助识别不同说话人，但如果多人同时说话，转写会更难阅读。遇到声音重叠时，建议在使用结果前先检查说话人标签和不清晰的句子。

检查人名、数字和专业术语

人名、产品名、数字、日期和行业术语往往承载关键信息。在分享、翻译、导出或发布文本前，最好先把这些细节核对清楚。

为什么 Decopy 让语音转文字更简单

长内容也能快速处理

无论是长录音、课程、播客还是视频语音，都能更快转成文字，让你更早开始查看结果。

对新用户也足够清晰

页面提供清晰的上传方式、明显的操作提示，以及从输入到转写的简单路径。

支持多语言

Decopy 支持 8 种网站语言，语音识别还能处理更多口语语言。说话人识别也能帮助整理多语言或多人内容。

灵活的输入方式

你可以从音频文件、视频文件、浏览器录音、播客或链接开始，在同一个流程里完成语音转文字。

隐私保护

你的文件和转写内容会保持私密，不会用于模型训练。你可以随时删除历史记录和保存项目，删除后将永久移除，无法恢复。

支持电脑和手机

你可以在桌面端或移动端浏览器里使用语音转文字，在不同设备之间处理口语内容。

Speech to Text 用户评价

我不会直接照搬转写结果，但它确实能帮我确认客户到底说了什么。对我这种通话后还要补 follow-up 记录的人来说，这很有用。

Robert Kim

销售顾问

面对很长的课程内容，我主要用转写来找回自己漏掉的部分。总结当然也有帮助，但最实用的是我可以直接回到自己需要的那一段。

James Walker

大学生

我经常会在真正动笔前，先把一些粗糙想法直接说出来。语音录下来能让我少一点顾虑、多说一点，而转写又能让我之后更轻松地阅读、整理并把它变成内容。

Sophie Chen

内容创作者

常见问题（FAQ）

你可以上传文件、粘贴链接，或者直接在浏览器中录音。开始转写前，请先选择正确的语言；如果内容里有多位说话人，也请先开启说话人识别。

先从源音频质量看起。音量太低、背景噪音、回声、音乐、语速过快和多人同时说话，都会让转写更难阅读。建议先通过音频回放检查那些不清楚的片段。

可以。转写完成后，你可以查看说话人标签、重命名说话人、添加新说话人，或者在整篇转写中统一替换名称。

你可以用 Summary 先看重点，用 Mind Map 理解结构，或者直接通过 AI Chat 针对转写内容提问。

不一定。AI Chat 可以帮助你直接围绕转写后的文本提问。你可以询问某个决定、主题、引用、截止时间或具体细节，再回到原转写中核对。

可以。转写结果可以作为字幕或 caption 的起点。发布前，建议你检查标点、时间轴、说话人切换、人名和重要术语。

可以。转写完成后，你可以把文本翻译成其他语言。如果原始语音不是你的语言，或者内容需要跨语言理解，这会很有帮助。

建议检查说话人标签、标点、专业术语、翻译部分以及所有关键段落。如果用于正式场景，最好把重点内容和原始音频再对照一遍。

可以。Decopy 运行在浏览器里，支持桌面端和移动端。你可以上传内容、录音、查看转写，并在不同设备上继续处理。

你上传的文件和转写结果不会公开、不会分享给其他用户，也不会用于模型训练。你也可以随时删除历史记录和保存内容；一旦删除，将无法恢复。

语音转文字是用户侧看到的功能目标，也就是把说出来的话变成书面文本。自动语音识别，也就是 ASR，则是实现这个过程的底层技术。

音频转文字更偏向处理音频文件本身。语音转文字则更强调口语内容本身，因此可以覆盖录音、浏览器音频、视频语音、播客、链接、语音备忘录等更广泛的语音来源。

↑