OpenAI语音识别(无需网络)

1 Whisper简介

如果希望离线识别语音,可以使用 OpenAI 的 Whisper,它是一个基于深度学习的语音识别模型,支持多语言(包括中文)。


2 Whisper安装

# 也可使用 GPU 加速(需安装 PyTorch)。
pip install openai-whisper


3 Whisper使用

import whisper

# 加载模型(第一次运行会自动下载)
model = whisper.load_model("base") # 可选 small / medium / large

# 加载音频文件并进行转录
result = model.transcribe("example.wav", language="zh") # 中文语音
print("识别结果:", result["text"])
import whisper

# 加载模型,并指定在 CPU 上使用 FP32 精度,download_root: 这是一个可选参数,用于指定模型下载的根目录。
model = whisper.load_model("small", device="cpu", download_root="./whisper_models")

# 转写音频文件(支持 mp3、wav、m4a 等格式)
result = model.transcribe("2.mp3", language="zh", fp16=False)

print("识别结果:", result["text"])


相关推荐

  • 生成图片

    from PIL import Image, ImageColor, ImageDraw, ImageFont, ImageFilterdef create_image_with_text(size, color, text, font_path, font_size, text_color, shadow_color, output_path): """ Create a new image of specified size and color with centered text that has a border and shadow. :param size: A tuple con

  • 获取指定目录下的所有图片信息

    1 获取指定目录下的所有图片信息// 获取指定目录下的所有图片信息 public function getImagesInfo($directory) { $images = []; // 创建递归目录迭代器 $iterator = new \RecursiveIteratorIterator( new \RecursiveDirectoryIterator($directory, \RecursiveDirectoryIterator::SKIP_DOTS), \RecursiveIteratorIterator::LEAVES_ONLY ); // 遍历目录中的每个文件 foreach (

  • Thinkphp各版本的PHP要求

    ThinkPHP 8.0:运行环境要求PHP8.0+,兼容PHP8.3ThinkPHP 6.1:运行环境要求PHP7.2+,兼容PHP8.1ThinkPHP 6.0:运行环境要求PHP7.2+,兼容PHP8.1ThinkPHP 5.1:运行环境要求PHP5.6+,兼容PHP8.0ThinkPHP 5.0:运行环境要求PHP5.4+,兼容PHP7.3