เอกสารร่าง / รอการตรวจสอบ / รอการอนุมัติ / ผ่านการอนุมัติให้ลงทะเบียนและจัดเก็บ
You're currently viewing an old version of this dataset. To see the current version, click here.

Lotus CaLLii

ฐานข้อมูลเสียงพูดภาษาไทย บันทึกผ่านระบบคอลเซ็นเตอร์ที่เข้ารหัสสัญญาณเสียงแบบ mu-law พัฒนาขึ้นเพื่อใช้ในงานวิจัยและพัฒนาระบบระบุช่วงเวลาพูดของแต่ละบุคคล (Speaker Diarization System) และระบบรู้จำบุคคลจากเสียง (Speaker Recognition System) เนื้อหาของเสียงพูดเกี่ยวกับการแพทย์และการท่องเที่ยวโดยใช้ข้อมูลสมมติทั้งหมด เสียงพูดมาจากอาสาสมัคร 186 คน โดยมีอักษรย่อ F แทนผู้หญิง และ M แทนผู้ชาย จากแหล่งข้อมูล 4 แหล่ง ความยาวรวมทั้งสิ้น 3,863 นาที

ข้อมูลและทรัพยากร

This dataset has no data

ข้อมูลเพิ่มเติม

ฟิลด์ ค่า
* ประเภทชุดข้อมูล ข้อมูลประเภทอื่นๆ
คลังข้อมูลเสียงที่บันทึกผ่านระบบโทรศัพท์คอลเซ็นเตอร์
ยินยอมให้นำชื่อชุดข้อมูลไปใช้ที่ GD-Catalog ไม่ยินยอม
* ชื่อฝ่ายงานสำหรับติดต่อ สุรศักดิ์ บุญกล้า
* อีเมลสำหรับติดต่อ surasak.boonkla@nectec.or.th
* วัตถุประสงค์ อื่นๆ
พัฒนาระบบปัญญาประดิษฐ์การประมวลผลสัญญาณเสียงพูด
* หน่วยความถี่ของการปรับปรุงข้อมูล ไม่ทราบ
ค่าความถี่ของการปรับปรุงข้อมูล (ความถี่น้อยที่สุด)
* ขอบเขตเชิงภูมิศาสตร์หรือเชิงพื้นที่ ประเทศ
* แหล่งที่มา เนคเทค
* รูปแบบการเก็บข้อมูล Audio
* หมวดหมู่ข้อมูลตามธรรมาภิบาลข้อมูลภาครัฐ ข้อมูลสาธารณะ
* ระดับการเปิดเผยข้อมูล ข้อมูลสาธารณะ
* สัญญาอนุญาตให้ใช้ข้อมูล อื่นๆ
ฺCC 4.0 BY SA NC
เงื่อนไขในการเข้าถึงข้อมูล ต้องกรอกข้อมูลให้ครบถ้วน ส่งให้ผู้ดูแลข้อมูลพิจารณา หากผ่านเกณฑ์พิจารณาจะได้รหัสผ่านในการเปิดไฟล์
ผู้สนับสนุนหรือผู้ร่วมดำเนินการ หน่วยงานเอกชน
หน่วยที่ย่อยที่สุดของการจัดเก็บข้อมูล
URL https://aiforthai.in.th/corpus.php
ภาษาที่ใช้ ไทย
วันที่เริ่มต้นสร้าง 3 พฤษภาคม 2565
วันที่ปรับปรุงข้อมูลล่าสุด 14 กันยายน 2565
สร้างโดย Gravatar กริช นาสิงห์ขันธุ์
สร้างในระบบเมื่อ 6 พฤษภาคม 2567
ปรับปรุงครั้งล่าสุดในระบบเมื่อ 5 กุมภาพันธ์ 2569