เอกสารร่าง / รอการตรวจสอบ / รอการอนุมัติ / ผ่านการอนุมัติให้ลงทะเบียนและจัดเก็บ

You're currently viewing an old version of this dataset. To see the current version, click here.

Lotus CaLLii

ฐานข้อมูลเสียงพูดภาษาไทย บันทึกผ่านระบบคอลเซ็นเตอร์ที่เข้ารหัสสัญญาณเสียงแบบ mu-law พัฒนาขึ้นเพื่อใช้ในงานวิจัยและพัฒนาระบบระบุช่วงเวลาพูดของแต่ละบุคคล (Speaker Diarization System) และระบบรู้จำบุคคลจากเสียง (Speaker Recognition System) เนื้อหาของเสียงพูดเกี่ยวกับการแพทย์และการท่องเที่ยวโดยใช้ข้อมูลสมมติทั้งหมด เสียงพูดมาจากอาสาสมัคร 186 คน โดยมีอักษรย่อ F แทนผู้หญิง และ M แทนผู้ชาย จากแหล่งข้อมูล 4 แหล่ง ความยาวรวมทั้งสิ้น 3,863 นาที

ข้อมูลและทรัพยากร

This dataset has no data

ข้อมูลเพิ่มเติม

ฟิลด์	ค่า
* ประเภทชุดข้อมูล	ข้อมูลประเภทอื่นๆ
	คลังข้อมูลเสียงที่บันทึกผ่านระบบโทรศัพท์คอลเซ็นเตอร์
ยินยอมให้นำชื่อชุดข้อมูลไปใช้ที่ GD-Catalog	ไม่ยินยอม
* ชื่อฝ่ายงานสำหรับติดต่อ	สุรศักดิ์ บุญกล้า
* อีเมลสำหรับติดต่อ	surasak.boonkla@nectec.or.th
* วัตถุประสงค์	อื่นๆ
	พัฒนาระบบปัญญาประดิษฐ์การประมวลผลสัญญาณเสียงพูด
* หน่วยความถี่ของการปรับปรุงข้อมูล	ไม่ทราบ

ค่าความถี่ของการปรับปรุงข้อมูล (ความถี่น้อยที่สุด)
* ขอบเขตเชิงภูมิศาสตร์หรือเชิงพื้นที่	ประเทศ

* แหล่งที่มา	เนคเทค
* รูปแบบการเก็บข้อมูล	Audio

* หมวดหมู่ข้อมูลตามธรรมาภิบาลข้อมูลภาครัฐ	ข้อมูลสาธารณะ
* ระดับการเปิดเผยข้อมูล	ข้อมูลสาธารณะ
* สัญญาอนุญาตให้ใช้ข้อมูล	อื่นๆ
	ฺCC 4.0 BY SA NC
เงื่อนไขในการเข้าถึงข้อมูล	ต้องกรอกข้อมูลให้ครบถ้วน ส่งให้ผู้ดูแลข้อมูลพิจารณา หากผ่านเกณฑ์พิจารณาจะได้รหัสผ่านในการเปิดไฟล์
ผู้สนับสนุนหรือผู้ร่วมดำเนินการ	หน่วยงานเอกชน

หน่วยที่ย่อยที่สุดของการจัดเก็บข้อมูล

URL	https://aiforthai.in.th/corpus.php
ภาษาที่ใช้	ไทย

วันที่เริ่มต้นสร้าง	3 พฤษภาคม 2565
วันที่ปรับปรุงข้อมูลล่าสุด	14 กันยายน 2565
สร้างโดย	กริช นาสิงห์ขันธุ์
สร้างในระบบเมื่อ	6 พฤษภาคม 2567
ปรับปรุงครั้งล่าสุดในระบบเมื่อ	5 กุมภาพันธ์ 2569