lasha-9ADDminხმოვანი ფაილების ჩაწერა კი კარგია, მაგრამ მთლად ასე მარტივად არაა საქმე
ამიტომაც არაა ბევრი ადამიანი, რომ ხელი მოკიდოს ამ საქმეს...
ჩემი აზრით (რაც ამ წამს მომაფიქრდა):
ერთ-ერთი სირთულე ისაა, რომ მეტყველებაში ჩვენ არ წარმოვთქვამთ თითოეულ ბგერას ცალ-ცალკე, არამედ მათ კომბინაციებს:
დაუკვირდით, რომ სიტყვა "დედა" ორი მარცვლისგან შედგება: დე-და
თითოეული ცალ-ცალკე წარმოთქვით. არ ჟღერს ვითომ 'დ' და 'ე'-ს ერთდროულად წარმოთქვამ?
ახლა კი წარმოთქვით დ-ე-დ-ა, განცალკავებულად. ხომ არაბუნებრივად ჟღერს? ასეთი მონაყოლის მოსმენა ძალიან გაუჭირდება მომხმარებელს.
მარცვლების გარდა, შესაძლოა უფრო რთული კონსტრუქციები იყოს, ეგ ფილოლოგებთან(?) უნდა გაირკვეს.
იდეალურად, ჩემი აზრით, ხმის სინთეზი უნდა მოხდეს.:
უნდა გაანალიზდეს თითოეული შესაძლებელი მარცვლისა და ბგერის შემადგენელი სიხშირეთა დიაპაზონი.
მოხდეს ამ სიხშირეების გენერირება პაკეტების სახით და მერე ხმად გარდაქმნა -> აუდიო გამოსავალში გაგზავნა.
ამავდროულად ხმის ტემბრის, ტონალობის, სიჩქარის შეცვლის შესაძლებლობა შეიქმნება.
ძალიან საინტერესო იქნებოდა მანქანური სწავლების და ხელოვნური ინტელექტის ალგორითმების გამოყენება... ამ ვარიანტში, შესაძლებელია დროთა განმავლობაში, პრაქტიკით ჟღერადობის, სიმკვეთრის გაუმჯობესება და ა.შ.
მოკლედ, მე ამაში არანაირი გამოცდილება არ მაქვს, უბრალოდ რაღაც აზრები გამიჩნდა. იმედია ვინმეს გამოადგება
წარმატებას ვუსურვებ იმათ, ვინც ამას ხელს მოკიდებს
* * *
მგონია, სასარგებლო იქნებოდა შემდეგი(უფასო) კურსის გავლა:
Natural Language Processing
https://www.coursera.org/course/nlangp