Tổng quan Audio to text (recognition)
Ứng dụng Tập tin âm thanh thành văn bản được thiết kế để nhận dạng các tập tin âm thanh với lời nói của con người thành văn bản (lời nói thành văn bản). Ứng dụng này chưa được dùng để ghi âm giọng nói (sử dụng các ứng dụng khác cho việc này, ví dụ: máy ghi âm tiêu chuẩn).
Chúng tôi không khuyên bạn sử dụng để nhận dạng các từ từ bài hát, video và bất kỳ bản ghi nào khác có chứa tạp âm không liên quan (ngoại trừ giọng nói của người nói), trong trường hợp này, việc nhận dạng rất có thể không đạt yêu cầu.
Chúng tôi khuyên bạn nên sử dụng nó để nhận dạng các bản ghi âm giọng nói được thực hiện với chất lượng âm thanh cao khi người nói ở càng gần thiết bị ghi âm càng tốt và không có tạp âm bên ngoài.
Tính năng ứng dụng:
- Nhận dạng các bản ghi âm ngắn (dài tối đa 1 phút)
- Nhận dạng các bản ghi âm dài (dài hơn 1 phút)
- Nó hỗ trợ nhận dạng từ hầu hết các định dạng âm thanh - MP3, OGG (opus Codec), AAC, MPEG, AMR, WAV, M4A, FLAC và các định dạng khác. Nhưng chúng tôi khuyên bạn nên sử dụng .FLAC
- Hỗ trợ nhận dạng từ 120 ngôn ngữ
- “Tự động chấm câu” có sẵn cho một số ngôn ngữ.
- Văn bản được nhận dạng được lưu trong ứng dụng.
- Khả năng "Chia sẻ" văn bản với bất kỳ phương thức điện thoại nào có sẵn
- Khả năng chỉnh sửa văn bản theo cách thủ công
- Khả năng xuất sang các định dạng văn bản (cho phiên bản Android <10)
- Nhận dạng các tệp âm thanh sau khi “Chia sẻ” từ các ứng dụng khác (Ví dụ: Ứng dụng Whats - tin nhắn thoại. Và các ứng dụng để xem tệp).
Cách hoạt động:
1) Bạn chọn tệp âm thanh của một người
2) Chọn ngôn ngữ nhận dạng và cài đặt bổ sung (nếu có cho ngôn ngữ đã chọn)
3) Nhấn nút “Bắt đầu”
4) Tệp âm thanh được tải xuống máy chủ và định dạng của nó được chuyển đổi thành FLAC
5) Sau khi chuyển đổi, một yêu cầu được thực hiện đối với Speech-To-Text và máy chủ trả về kết quả nhận dạng
Nhận dạng giọng nói sử dụng giải pháp đám mây của Google - Nói thành văn bản, yêu cầu thanh toán để nhận dạng một đơn vị thời gian, do đó, ứng dụng không miễn phí và đối với mỗi lần nhận dạng, chúng tôi buộc phải tính phí người dùng. Hãy đối xử với điều này với sự hiểu biết.
Chúng tôi không khuyên bạn sử dụng để nhận dạng các từ từ bài hát, video và bất kỳ bản ghi nào khác có chứa tạp âm không liên quan (ngoại trừ giọng nói của người nói), trong trường hợp này, việc nhận dạng rất có thể không đạt yêu cầu.
Chúng tôi khuyên bạn nên sử dụng nó để nhận dạng các bản ghi âm giọng nói được thực hiện với chất lượng âm thanh cao khi người nói ở càng gần thiết bị ghi âm càng tốt và không có tạp âm bên ngoài.
Tính năng ứng dụng:
- Nhận dạng các bản ghi âm ngắn (dài tối đa 1 phút)
- Nhận dạng các bản ghi âm dài (dài hơn 1 phút)
- Nó hỗ trợ nhận dạng từ hầu hết các định dạng âm thanh - MP3, OGG (opus Codec), AAC, MPEG, AMR, WAV, M4A, FLAC và các định dạng khác. Nhưng chúng tôi khuyên bạn nên sử dụng .FLAC
- Hỗ trợ nhận dạng từ 120 ngôn ngữ
- “Tự động chấm câu” có sẵn cho một số ngôn ngữ.
- Văn bản được nhận dạng được lưu trong ứng dụng.
- Khả năng "Chia sẻ" văn bản với bất kỳ phương thức điện thoại nào có sẵn
- Khả năng chỉnh sửa văn bản theo cách thủ công
- Khả năng xuất sang các định dạng văn bản (cho phiên bản Android <10)
- Nhận dạng các tệp âm thanh sau khi “Chia sẻ” từ các ứng dụng khác (Ví dụ: Ứng dụng Whats - tin nhắn thoại. Và các ứng dụng để xem tệp).
Cách hoạt động:
1) Bạn chọn tệp âm thanh của một người
2) Chọn ngôn ngữ nhận dạng và cài đặt bổ sung (nếu có cho ngôn ngữ đã chọn)
3) Nhấn nút “Bắt đầu”
4) Tệp âm thanh được tải xuống máy chủ và định dạng của nó được chuyển đổi thành FLAC
5) Sau khi chuyển đổi, một yêu cầu được thực hiện đối với Speech-To-Text và máy chủ trả về kết quả nhận dạng
Nhận dạng giọng nói sử dụng giải pháp đám mây của Google - Nói thành văn bản, yêu cầu thanh toán để nhận dạng một đơn vị thời gian, do đó, ứng dụng không miễn phí và đối với mỗi lần nhận dạng, chúng tôi buộc phải tính phí người dùng. Hãy đối xử với điều này với sự hiểu biết.
Xem thêm
Những bình luận về Audio to text (recognition) bản Android