FMUSER უფრო მარტივად გადასცემს ვიდეოს და აუდიოს!

[ელ.ფოსტით დაცულია] WhatsApp + 8618078869184
ენა

    აუდიო დამუშავება -1 ძირითადი ცოდნა

     

    აუდიო


    ეხება ბგერულ ტალღებს, რომელთა ხმის სიხშირეა 20 ჰერციდან და 20 კჰც-მდე, რომელიც შეიძლება მოისმინოს ადამიანის ყურმა.

    თუ კომპიუტერს დაამატებთ შესაბამის აუდიო ბარათს - ხმოვან ბარათს, რომელსაც ჩვენ ხშირად ვამბობთ, ჩვენ შეგვიძლია ჩავწეროთ ყველა ბგერა, ხოლო ხმის აკუსტიკური მახასიათებლები, მაგალითად, ხმის დონე, შეიძლება შენახული იქნას როგორც ფაილები კომპიუტერის მყარზე დისკი ამის საპირისპიროდ, შეგვიძლია გამოვიყენოთ გარკვეული აუდიო პროგრამა შენახული აუდიო ფაილის ასამაღლებლად ადრე ჩაწერილი ხმის აღსადგენად.

     

    1 აუდიო ფაილის ფორმატი
    აუდიო ფაილის ფორმატი სპეციალურად ეხება აუდიო მონაცემების შენახვის ფაილის ფორმატს. ბევრი სხვადასხვა ფორმატია.

    აუდიო მონაცემების მოპოვების ზოგადი მეთოდი არის აუდიო ძაბვის შერჩევა (კვანტიზაცია) ფიქსირებული დროის ინტერვალში და შედეგის შენახვა გარკვეული რეზოლუციით (მაგალითად, CDDA– ს თითოეული ნიმუში არის 16 ბიტი ან 2 ბაიტი). შერჩევის ინტერვალს შეიძლება ჰქონდეს განსხვავებული სტანდარტები. მაგალითად, CDDA იყენებს 44,100 ჯერ წამში; DVD წამში იყენებს 48,000 ან 96,000 ჯერ. ამიტომ, [შერჩევის სიჩქარე], [რეზოლუცია] და [არხების] რაოდენობა (მაგალითად, 2 არხი სტერეოსათვის) აუდიო ფაილის ფორმატის ძირითადი პარამეტრია.

     

    1.1 დანაკარგი და უდანაკარგო
    ციფრული აუდიოს წარმოების პროცესის მიხედვით, აუდიო კოდირება შეიძლება უსასრულოდ ახლოს იყოს ბუნებრივ სიგნალებთან. ყოველ შემთხვევაში, ახლანდელ ტექნოლოგიას მხოლოდ ამის გაკეთება შეუძლია. ნებისმიერი ციფრული აუდიო კოდირების სქემა კარგავს, რადგან მისი სრული აღდგენა შეუძლებელია. კომპიუტერულ პროგრამებში, ერთგულების ყველაზე მაღალი დონეა PCM კოდირება, რომელიც ფართოდ გამოიყენება მასალების შენარჩუნებისა და მუსიკის დასაფასებლად. იგი გამოიყენება CD, DVD და ჩვენს საერთო WAV ფაილებში. ამიტომ, PCM კონვენციით გახდა უდანაკარგო კოდირება, რადგან PCM წარმოადგენს ციფრულ აუდიოში ერთგულების საუკეთესო დონეს.

     

    აუდიო ფაილების ფორმატის ორი ძირითადი ტიპი არსებობს:

    დაკარგვის ფორმატები, როგორიცაა WAV, PCM, TTA, FLAC, AU, APE, TAK, WavPack (WV)
    დანაკარგის ფორმატები, როგორიცაა MP3, Windows Media Audio (WMA), Ogg Vorbis (OGG), AAC

     


    2 პარამეტრის შესავალი


    2.1 შერჩევის სიჩქარე


    ეხება წამში მიღებული ხმის ნიმუშების რაოდენობას. ხმა სინამდვილეში ერთგვარი ენერგეტიკული ტალღაა, ამიტომ მას ასევე აქვს სიხშირისა და ამპლიტუდის მახასიათებლები. სიხშირე შეესაბამება დროის ღერძს და ამპლიტუდა შეესაბამება დონის ღერძს. ტალღა უსასრულოდ გლუვია და სიმები შეიძლება ჩაითვალოს, როგორც უამრავი წერტილისგან შემდგარი. იმის გამო, რომ შენახვის სივრცე შედარებით შეზღუდულია, ციფრული კოდირების პროცესში სიმების აღება უნდა მოხდეს.

     

    შერჩევის პროცესი არის გარკვეული წერტილის სიხშირის მნიშვნელობის ამოღება. ცხადია, რაც უფრო მეტ ქულას იღებენ ერთ წამში, მით მეტი ინფორმაციის მიღება ხდება. ტალღის ფორმის აღსადგენად, რაც უფრო მაღალია სინჯის აღების სიხშირე, მით უკეთესი იქნება ხმის ხარისხი. უფრო რეალურია რესტავრაცია, მაგრამ ამავე დროს ის უფრო მეტ რესურსს იკავებს. ადამიანის ყურის შეზღუდული რეზოლუციის გამო, ძალიან მაღალი სიხშირის გამოყოფა შეუძლებელია. ჩვეულებრივ გამოიყენება 22050 შერჩევის სიხშირე, 44100 უკვე CD ბგერის ხარისხია, ხოლო 48,000 ან 96,000-ზე მეტი სინჯის აღება ადამიანის ყურისთვის აღარ არის მნიშვნელოვანი. ეს ფილმებში წამში 24 კადრის მსგავსია. თუ ეს არის სტერეო, ნიმუში გაორმაგებულია და ფაილი თითქმის გაორმაგებულია.

     

    ნიქვისტის სინჯების თეორიის თანახმად, იმის უზრუნველსაყოფად, რომ ხმა არ არის დამახინჯებული, სინჯის აღების სიხშირე დაახლოებით 40 კჰც უნდა იყოს. ჩვენ არ უნდა ვიცოდეთ, როგორ გაჩნდა ეს თეორემა. მხოლოდ ის უნდა ვიცოდეთ, რომ ეს თეორემა გვეუბნება, რომ თუ სიგნალის ზუსტად ჩაწერა გვინდა, ჩვენი სინჯის აღების სიხშირე უნდა იყოს აუდიოსიგნალის მაქსიმალური სიხშირეზე მეტი ან ტოლი გახსოვდეთ, ეს არის მაქსიმალური სიხშირე.

     

    ციფრული აუდიოს სფეროში, ხშირად გამოყენებული შერჩევის მაჩვენებლებია:

    8000 Hz - ტელეფონის მიერ გამოყენებული შერჩევის სიჩქარე, რაც ადამიანის სიტყვისთვის საკმარისია
    11025 Hz- შერჩევის სიჩქარე, რომელსაც ტელეფონი იყენებს
    22050 Hz- შერჩევის სიჩქარე, რომელიც გამოიყენება რადიომაუწყებლობაში
    32000 Hz- შერჩევის სიჩქარე miniDV ციფრული ვიდეო კამერისთვის, DAT (LP რეჟიმი)
    44100 Hz-Audio CD, რომელიც ასევე ხშირად გამოიყენება MPEG-1 აუდიოსთვის (VCD, SVCD, MP3) შერჩევის სიჩქარედ
    47250 Hz- შერჩევის სიჩქარე, რომელსაც იყენებენ კომერციული PCM ჩამწერები
    48000 Hz- შერჩევის სიჩქარე ციფრული ხმისთვის, რომელიც გამოიყენება miniDV, ციფრულ ტელევიზორში, DVD, DAT, ფილმებში და პროფესიონალურ აუდიოში
    50000 ჰერციანი სინჯის აღების სიჩქარე, რომელსაც იყენებენ კომერციული ციფრული ჩამწერები
    96000 Hz ან 192000 Hz - შერჩევის სიჩქარე, რომელიც გამოიყენება DVD- აუდიოზე, ზოგიერთ LPCM DVD აუდიო ტრეკზე, BD-ROM (Blu-ray დისკი) აუდიო ტრეკებზე და HD-DVD (მაღალი განმარტება DVD) აუდიო ტრეკებზე


    2.2 შერჩევის ბიტების რაოდენობა
    შერჩევის ბიტების რაოდენობას ასევე უწოდებენ შერჩევის ზომას ან რაოდენობრივი ბიტების რაოდენობას. ეს არის პარამეტრი, რომელიც გამოიყენება ხმის რხევის, ანუ ხმის კარტის რეზოლუციის გასაზომად ან შეიძლება გავიგოთ, როგორც ხმოვანი კარტის მიერ დამუშავებული ხმოვანი ბარათის რეზოლუცია. რაც უფრო დიდი მნიშვნელობა აქვს, მით უფრო მაღალია რეზოლუცია და მით უფრო რეალურია ჩაწერილი და დაკრული ხმა. ხმის კარტის ბიტი გულისხმობს ციფრული ხმოვანი სიგნალის ორობით ციფრებს, რომელსაც ხმოვანი კარტა იყენებს ხმოვანი ფაილების შეგროვებისა და თამაშის დროს. ხმის კარტის ბიტი ობიექტურად ასახავს ციფრული ხმოვანი სიგნალის შეყვანის ხმოვანი სიგნალის აღწერილობის სიზუსტეს. საერთო ხმოვანი ბარათები ძირითადად 8-ბიტიანია და 16-ბიტიანი. დღესდღეობით, ყველა ზომიერი პროდუქტი ბაზარზე არის 16 ბიტიანი და ზემოთ ხმის კარტები.

     

    თითოეული შერჩეული მონაცემები აფიქსირებს ამპლიტუდას, ხოლო სინჯის სიზუსტე დამოკიდებულია სინჯის ბიტების რაოდენობაზე:

    1 ბაიტი (ეს არის 8 ბიტი) მხოლოდ 256 რიცხვის ჩაწერაა, რაც ნიშნავს, რომ ამპლიტუდა მხოლოდ 256 დონეზე შეიძლება დაიყოს;
    2 ბაიტი (ეს არის 16 ბიტი) შეიძლება იყოს მცირე 65536, რაც უკვე CD სტანდარტია;
    4 ბაიტს (ეს არის 32 ბიტი) შეუძლია ამპლიტუდის დაყოფა 4294967296 დონეზე, რაც ნამდვილად ზედმეტია.
    2.3 არხების რაოდენობა
    ეს არის ხმის არხების რაოდენობა. საერთო მონო და სტერეო (ორმაგი არხი) ახლა განვითარდა ოთხხმიან ხმოვან გარსზე (ოთხარხიანი) და 5.1 არხზე.

     

    2.3.1 მონო
    მონო არის ბგერის რეპროდუქციის შედარებით პრიმიტიული ფორმა და ადრეული ხმის ბარათები მას უფრო ხშირად იყენებდნენ. მონო ჟღერადობა მხოლოდ ერთი დინამიკის საშუალებით შეიძლება გაჟღერდეს, ზოგი ასევე დამუშავებულია ორ დინამიკად იმავე ხმის არხის გამოსასვლელად. მონოფონიური ინფორმაციის დაკვრისას ორი დინამიკის საშუალებით, აშკარად ვგრძნობთ, რომ ხმა ორი დინამიკიდან მოდის. შეუძლებელია ხმის წყაროს სპეციფიკური ადგილმდებარეობის დადგენა, რომელიც გადაეცემა ჩვენს ყურებს დინამიკის შუა ნაწილიდან.

     

    2.3.2 სტერეო
    Binaural არხებს აქვთ ორი ხმის არხი. პრინციპი ისაა, რომ როდესაც ადამიანები ხმას ისმენენ, მათ შეუძლიათ განიხილონ ხმის წყაროს კონკრეტული პოზიცია მარცხენა და მარჯვენა ყურებს შორის ფაზური განსხვავების საფუძველზე. ხმის ჩაწერა ხორციელდება ორ დამოუკიდებელ არხზე ჩაწერის პროცესში, ისე, რომ მივაღწიოთ კარგი ხმის ლოკალიზაციის ეფექტს. ეს ტექნიკა განსაკუთრებით გამოდგება მუსიკის დაფასებისას. მსმენელს შეუძლია მკაფიოდ განასხვაოს ის მიმართულება, საიდანაც სხვადასხვა ინსტრუმენტები მოდის, რაც მუსიკას უფრო წარმოსახვით ხდის და უფრო უახლოვდება გამოცდილებას.

     

    ამჟამად ორი ხმა ყველაზე ხშირად გამოიყენება. კარაოკეში ერთი არის მუსიკის დასაკრავად და მეორე მომღერლის ხმისთვის; VCD- ში ერთი მანდარინის ენაზე დუბლირებას აკეთებს, ხოლო მეორე კანტონურ ენაზე.

     

    2.3.3 ოთხტონიანი გარს
    ოთხარხიანი გარს განსაზღვრავს ხმოვან სიბრტყის ოთხ წერტილს, წინა მარცხნივ, წინა მარჯვნივ, უკანა მარცხნივ და უკანა მარჯვნივ, და აუდიტორია მათ გარშემო აკრავს. ასევე რეკომენდებულია ქვევუფერის დამატება, დაბალი სიხშირის სიგნალების დაკვრის დამუშავების გასაძლიერებლად (ეს არის მიზეზი, რის გამოც დღეს 4.1-არხიანი დინამიკის სისტემები დიდი პოპულარობით სარგებლობს). რაც შეეხება საერთო ეფექტს, ოთხარხიან სისტემას შეუძლია მსმენელს შემოუტანოს გარსის ხმა სხვადასხვა მიმართულებით, შეუძლია შეიძინოს სხვადასხვა გარემოში ყოფნის აუდიტორული გამოცდილება და მომხმარებლებს შესძინოს ახალი გამოცდილება. დღესდღეობით, ოთხი არხიანი ტექნოლოგია ფართოდ არის ინტეგრირებული სხვადასხვა საშუალო და მაღალი დონის ხმოვანი ბარათების დიზაინში, რაც სამომავლო განვითარების მთავარ ტენდენციად იქცა.

     

    2.3.4 5.1 არხი
    5.1 არხი ფართოდ იქნა გამოყენებული სხვადასხვა ტრადიციულ თეატრებში და საოჯახო თეატრებში. ხმის ჩამწერი კომპრესიული ფორმატის ზოგიერთი უფრო ცნობილი ფორმა, როგორიცაა Dolby AC-3 (Dolby Digital), DTS და ა.შ., დაფუძნებულია 5.1 ხმოვან სისტემაზე. ".1" არხი არის სპეციალურად შექმნილი საბვუფერის არხი, რომელსაც შეუძლია წარმოქმნას საბვუფერი, სიხშირის რეაგირების დიაპაზონიდან 20-დან 120 ჰც-მდე. სინამდვილეში, 5.1 ხმოვანი სისტემა მოდის 4.1 გარსიდან, განსხვავება იმაშია, რომ ის დასძენს ცენტრალურ ერთეულს. ეს ცენტრალური განყოფილება პასუხისმგებელია ხმის სიგნალის 80 ჰერცზე დაბლა გადაცემაზე, რაც გამოსადეგია ადამიანის ხმის გამაძლიერებლად ფილმის ყურებისას და დიალოგის კონცენტრირება ხდება მთლიანი ხმოვანი ველის შუა ნაწილში, მთლიანი ეფექტის გასაზრდელად.

     

    ამჟამად, ბევრმა ონლაინ მუსიკალურმა ფლეერმა, როგორიცაა QQ Music, უზრუნველყო 5.1-არხიანი მუსიკა საცდელი მოსმენისა და ჩამოტვირთვისთვის.

     

    2.4 ჩარჩო
    აუდიოჩარჩოების კონცეფცია არ არის ისეთი გასაგები, როგორც ვიდეოჩარჩოები. ვიდეო კოდირების თითქმის ყველა ფორმატს შეუძლია უბრალოდ წარმოიდგინოს ჩარჩო, როგორც კოდირებული სურათი. ამასთან, აუდიო ჩარჩო დაკავშირებულია კოდირების ფორმატთან, რომელსაც ახორციელებს კოდირების თითოეული სტანდარტი.

     

    მაგალითად, PCM– ს შემთხვევაში (დაშიფრული აუდიო მონაცემები), მას საერთოდ არ სჭირდება ჩარჩოების კონცეფცია და მისი დაკვრა შესაძლებელია შერჩევის სიჩქარისა და სინჯის სინჯის სიზუსტის მიხედვით. მაგალითად, ორმაგი აუდიოსთვის, რომლის შერჩევის სიჩქარეა 44.1 kHZ და შერჩევის სიზუსტეა 16 ბიტი, შეგიძლიათ გამოთვალოთ რომ ბიტის სიჩქარეა 44100162bps და აუდიო მონაცემები წამში არის 44100162/8 ბაიტი.

     

    Amr ჩარჩო შედარებით მარტივია. ეს განსაზღვრავს, რომ აუდიოს ყოველ 20 მმ არის ჩარჩო, ხოლო აუდიოს თითოეული ჩარჩო დამოუკიდებელია, და შესაძლებელია სხვადასხვა კოდირების ალგორითმისა და კოდირების სხვადასხვა პარამეტრის გამოყენება.

     

    Mp3 ჩარჩო ოდნავ რთულია და შეიცავს მეტ ინფორმაციას, მაგალითად, შერჩევის სიჩქარე, ბიტის სიჩქარე და სხვადასხვა პარამეტრები.

     

    X ციკლი
    აუდიო მოწყობილობის მიერ ერთდროულად დამუშავებისათვის საჭირო ჩარჩოების რაოდენობა და აუდიო მოწყობილობის მონაცემებზე წვდომა და აუდიო მონაცემების შენახვა ემყარება ამ ერთეულს.

     

    2.6 გადაბმული რეჟიმი
    ციფრული აუდიოსიგნალის შენახვის მეთოდი. მონაცემები ინახება უწყვეტ ჩარჩოებში, ეს არის პირველი ჩარჩოს მარცხენა არხის ნიმუშების და მარჯვენა არხის ნიმუშების ჩაწერა და შემდეგ იწყება ჩარჩო 1-ის ჩაწერა.

     

    2.7 არაინტერლაციული რეჟიმი
    პირველ რიგში, ჩაწერეთ ყველა ჩარჩოს მარცხენა არხის ნიმუშები ერთ პერიოდში და შემდეგ ჩაიწერეთ არხის ყველა სწორი ნიმუში.

     

    2.8 ბიტის სიჩქარე (ბიტის სიჩქარე)
    ბიტის სიჩქარეს ბიტის სიჩქარესაც უწოდებენ, რაც გულისხმობს წამში მუსიკის მიერ დაკრული მონაცემების რაოდენობას. ერთეული გამოიხატება ბიტით, რაც ორობითი ბიტია. bps არის ბიტის სიჩქარე. b არის ბიტი (ბიტი), s არის მეორე (მეორე), p არის ყოველი (თითო), ერთი ბაიტი უდრის 8 ორობით ბიტს. ანუ, 4 წუთიანი სიმღერის ფაილის ზომა 128bps გამოითვლება ასე (128/8) 460 = 3840kB = 3.8MB, 1B (ბაიტი) = 8b (ბიტი), ზოგადად mp3 სასარგებლოა დაახლოებით 128 ბიტიანი სიჩქარე, და ეს ალბათ არის ზომა დაახლოებით 3-4 BM.

     

    კომპიუტერულ პროგრამებში, ერთგულების ყველაზე მაღალი დონეა PCM კოდირება, რომელიც ფართოდ გამოიყენება მასალის შენარჩუნებისა და მუსიკის დასაფასებლად. გამოყენებულია CD, DVD და ჩვენი საერთო WAV ფაილები. ამიტომ, PCM კონვენციით გახდა უდანაკარგო კოდირება, რადგან PCM წარმოადგენს ციფრულ აუდიოში ერთგულების საუკეთესო დონეს. ეს არ ნიშნავს, რომ PCM შეუძლია უზრუნველყოს სიგნალის აბსოლუტური ერთგულება. PCM– ს მხოლოდ მაქსიმალური უსასრულო სიახლოვის მიღწევა შეუძლია.

     

    PCM აუდიო ნაკადის ბიტის სიჩქარის გამოთვლა ძალიან მარტივი ამოცანაა, შერჩევის სიჩქარის მნიშვნელობა × სინჯის ზომის ზომა × არხის ნომერი bps. WAV ფაილი, შერჩევის სიჩქარე 44.1KHz, შერჩევის ზომა 16 ბიტი და ორმაგი არხი PCM კოდირებით, მისი მონაცემთა სიჩქარეა 44.1K × 16 × 2 = 1411.2Kbps. ჩვენი საერთო აუდიო CD იყენებს PCM კოდირებას, ხოლო CD– ს ტევადობა მხოლოდ 72 წუთის მუსიკალურ ინფორმაციას იტევს.

     

    ორმაგი არხის PCM კოდირებული აუდიოსიგნალი მოითხოვს 176.4 წამში 1 კბ სივრცეს, ხოლო 10.34 წუთში დაახლოებით 1 მ. ეს მომხმარებლების უმეტესობისთვის მიუღებელია, განსაკუთრებით მათთვის, ვისაც უყვარს მუსიკის მოსმენა კომპიუტერში. დისკის დატვირთვა, არსებობს მხოლოდ ორი მეთოდი, შემცირების სინჯის ინდექსი ან შეკუმშვა. არ არის მიზანშეწონილი შერჩევის ინდექსის შემცირება, ამიტომ ექსპერტებმა შეიმუშავეს კომპრესიის სხვადასხვა სქემა. ყველაზე ორიგინალურია DPCM, ADPCM და ყველაზე ცნობილი MP3. ამიტომ, მონაცემთა შეკუმშვის შემდეგ კოდის სიჩქარე გაცილებით დაბალია, ვიდრე თავდაპირველი კოდი.

     

    2.9 მაგალითის გაანგარიშება
    მაგალითად, "Windows XP startup.wav" - ის ფაილის სიგრძეა 424,644 22050 ბაიტი, რომელიც არის "16HZ / XNUMXbit / stereo" ფორმატის.

    შემდეგ მისი გადაცემის სიჩქარე წამში (ბიტის სიჩქარე, ასევე მოუწოდა ბიტის სიჩქარე, სინჯის აღების სიჩქარე) არის 22050162 = 705600 (ბაიტი), ბაიტის ერთეულად გადაკეთებულია 705600/8 = 88200 (ბაიტი წამში), დაკვრის დრო: 424644 (სულ ბაიტი) / 88200 (ბაიტი წამში) 4.8145578 XNUMX (წამი).

     

    მაგრამ ეს არ არის საკმარისად ზუსტი. WAVE ფაილს (* .wav) სტანდარტულ PCM ფორმატში აქვს მინიმუმ 42 ბაიტი სათაურის ინფორმაცია, რომელიც უნდა მოიხსნას დაკვრის დროის გამოთვლისას, ასე რომ არსებობს: (424644-42) / (22050162/8) 4.8140816 XNUMX ( წამი). ეს უფრო ზუსტია.

     

    3 PCM აუდიო კოდირება
    PCM ნიშნავს პულსის კოდის მოდულაციას. PCM პროცესში, შეყვანის ანალოგური სიგნალი სინჯდება, კვანტიზირდება და იშიფრება, ხოლო ორობითი კოდირებული ნომერი წარმოადგენს ანალოგური სიგნალის ამპლიტუდას; მიმღები ბოლოს აღადგენს ამ კოდებს თავდაპირველ ანალოგურ სიგნალში. ანუ, ციფრული აუდიოს A / D გარდაქმნა მოიცავს სამ პროცესს: შერჩევა, კვანტიზაცია და კოდირება.

     

    ხმის PCM- ის მიღების სიჩქარეა 8kHz, ხოლო სინჯის აღების ბიტი 8bit, ამიტომ ხმის ციფრული კოდირებული სიგნალის კოდის სიჩქარეა 8bit × 8kHz = 64kbps = 8KB / წმ.

     

    3.1 აუდიო კოდირების პრინციპები
    ვისაც აქვს გარკვეული ელექტრონული საფუძველი, იცის, რომ სენსორის მიერ შეგროვებული აუდიო სიგნალი არის ანალოგური სიდიდე, მაგრამ ის, რასაც რეალურ გადაცემის პროცესში ვიყენებთ, არის ციფრული სიდიდე. ეს მოიცავს ანალოგის ციფრულზე გარდაქმნის პროცესს. ანალოგურმა სიგნალმა უნდა გაიაროს სამი პროცესი, კერძოდ, სინჯის აღება, კვანტიზაცია და დაშიფვრა, ხმის დიგიტალიზაციის პულსის კოდის მოდულაციის (PCM, პულსის კოდირების მოდულაცია) ტექნოლოგიის გასაგებად.

     

    კონვერტაციის პროცესი


    3.1.1 შერჩევა
    შერჩევა არის ანალოგური სიგნალიდან სინჯების (სინჯის აღების სიჩქარე) მოპოვების სიხშირე, რომელიც სიგნალის სიჩქარეს 2-ჯერ აღემატება (Lequist Sampling Theorem) და დროის ღერძზე დისკრეტული სინჯის სიგნალად გადაქცევა.
    შერჩევის სიჩქარე: წამში უწყვეტი სიგნალიდან მოპოვებული ნიმუშების რაოდენობა დისკრეტული სიგნალის შესაქმნელად, გამოხატული ჰერცი (ჰერცი).


    ნიმუში:
    მაგალითად, აუდიო სიგნალის შერჩევის სიჩქარეა 8000 ჰერცი.
    გასაგებია, რომ ზემოთ მოყვანილ ფიგურაში მოცემული ნიმუში შეესაბამება ძაბვის ცვლილების მრუდეს დროში 1 წამში, შემდეგ ქვედა 1 2 3… 10, რადგან უნდა იყოს 1-8000 წერტილი, ანუ 1 მეორე დაყოფილია 8000 ნაწილად, შემდეგ კი გამოაქვს ისინი თავის მხრივ ძაბვის მნიშვნელობა, რომელიც შეესაბამება ამ 8000 წერტილოვან დროს.

     

    3.1.2 რაოდენობრივი განსაზღვრა
    მიუხედავად იმისა, რომ შერჩეული სიგნალი დისკრეტული სიგნალია დროის ღერძზე, ის მაინც ანალოგური სიგნალია და მისი ნიმუშის მნიშვნელობას შეიძლება ჰქონდეს ღირებულების უსასრულო რაოდენობა მნიშვნელობების გარკვეულ დიაპაზონში. "დამრგვალების" მეთოდი უნდა იქნას მიღებული ნიმუშის მნიშვნელობების "დამრგვალებისთვის", ისე, რომ ნიმუშის მნიშვნელობები გარკვეული მნიშვნელობის დიაპაზონში შეიცვალოს მნიშვნელობების უსასრულო რიცხვიდან მნიშვნელობების სასრულ რიცხვში. ეს პროცესი ე.წ. რაოდენობრივი განსაზღვრა.

     

    ბიტების შერჩევის რაოდენობა: ეხება ბიტების რაოდენობას, რომლებიც გამოიყენება ციფრული სიგნალის აღსაწერად.
    8 ბიტი (8 ბიტი) წარმოადგენს მე -2 მე -8 სიმძლავრეს = 256, 16 ბიტი (16 ბიტი) წარმოადგენს მე -2 მე -16 სიმძლავრეს = 65536;

     

    ნიმუში:
    მაგალითად, აუდიო სენსორის მიერ შეგროვებული ძაბვის დიაპაზონი არის 0-3.3 ვ, ხოლო სინჯის ნომერია 8 ბიტი (ბიტი)
    ანუ, ჩვენ კვანტიზაციის სიზუსტეს ვთვლით 3.3V / 2 ^ 8 = 0.0128.
    ჩვენ ვყოფთ 3.3v- ს 0.0128-ზე, როგორც საფეხურებიანი Y ღერძი, როგორც ეს ნაჩვენებია ნახაზზე 3, 1 2… 8 ხდება 0 0.0128 0.0256… 3.3 V
    მაგალითად, სინჯის აღების წერტილის ძაბვის მნიშვნელობაა 1.652V (1280.128-დან 1290.128-მდე). ჩვენ დავამრგვალეთ იგი 1.65 ვ-მდე და შესაბამისი კვანტიზაციის დონეა 128.

     

    3.1.3 კოდირება
    კვანტიზირებული შერჩევის სიგნალი გარდაიქმნება ათობითი ციფრული კოდის ნაკადებად, რომლებიც განლაგებულია შერჩევის მიმდევრობის, ანუ ათობითი ციფრული სიგნალის შესაბამისად. მონაცემთა მარტივი და ეფექტური სისტემაა ორობითი კოდის სისტემა. ამიტომ, ათობითი ციფრული კოდი უნდა გადაკეთდეს ორობით კოდში. ათობითი ციფრული კოდების მთლიანი რაოდენობის მიხედვით შეიძლება განისაზღვროს ორობითი კოდირებისთვის საჭირო ბიტების რაოდენობა, ანუ სიტყვის სიგრძე (სინჯების ბიტების რაოდენობა). კვანტიზირებული ნიმუშის სიგნალის ორობითი კოდის ნაკადში გარდაქმნის ამ პროცესს მოცემული სიტყვის სიგრძით ეწოდება კოდირება.

     

    ნიმუში:
    მაშინ ზემოხსენებული 1.65V შეესაბამება კვანტიზაციის დონეს 128. შესაბამისი ორობითი სისტემაა 10000000. ანუ სინჯების წერტილის კოდირების შედეგია 10000000. რა თქმა უნდა, ეს არის კოდირების მეთოდი, რომელიც არ ითვალისწინებს დადებით და უარყოფით მნიშვნელობებს და კოდირების მრავალი მეთოდი არსებობს, რომლებიც საჭიროებს კონკრეტული საკითხის სპეციფიკურ ანალიზს. (PCM აუდიო ფორმატის კოდირება არის A-law 13 პოლილინის კოდირება)

     

    3.2 PCM აუდიო კოდირება
    PCM სიგნალს არ გაუვლია რაიმე კოდირება და შეკუმშვა (უდანაკარგო შეკუმშვა). ანალოგურ სიგნალებთან შედარებით, მასზე ადვილად არ მოქმედებს გადამცემი სისტემის უწესრიგობა და დამახინჯება. დინამიური დიაპაზონი ფართოა და ხმის ხარისხიც საკმაოდ კარგია.

     

    3.2.1 PCM კოდირება
    გამოყენებული კოდირება არის A-law 13 პოლილინური კოდირება.
    დეტალებისთვის იხილეთ: PCM ხმოვანი კოდირება

     

    3.2.2 Channel
    არხები შეიძლება დაიყოს მონოდ და სტერეოებად (ორმაგი არხი).

    PCM- ის თითოეული ნიმუშის ღირებულება შეიცავს მთელ i რიცხვს, ხოლო i სიგრძე არის მინიმალური ბაიტი, რომელიც საჭიროა მითითებული ნიმუშის სიგრძის მოსათავსებლად.

     

    ნიმუშის ზომა მონაცემთა ფორმატი მინიმალური მნიშვნელობა მაქსიმალური მნიშვნელობა
    8 ბიტიანი PCM ხელმოუწერელი int 0 225
    16 ბიტიანი PCM int -32767 32767

     

    მონო ხმოვანი ფაილებისთვის, შერჩევის მონაცემები არის 8 ბიტიანი მოკლე მთელი რიცხვი (მოკლე int 00H-FFH) და სინჯის აღების მონაცემები ინახება ქრონოლოგიური თანმიმდევრობით.


    ორი არხიანი სტერეო ხმოვანი ფაილი, სინჯის აღების თითოეული მონაცემები არის 16 ბიტიანი მთელი რიცხვი (int), ზედა რვა ბიტი (მარცხენა არხი) და ქვედა რვა ბიტი (მარჯვენა არხი) შესაბამისად წარმოადგენს ორ არხს, ხოლო სინჯის აღების მონაცემები ქრონოლოგიური თანმიმდევრობით ანაბარი ალტერნატიული თანმიმდევრობით.
    იგივე ითქმის, როდესაც სინჯის აღების ბიტების რაოდენობაა 16 ბიტი, ხოლო შენახვა დაკავშირებულია ბაიტის თანმიმდევრობასთან.


    PCM მონაცემთა ფორმატი
    ქსელის ყველა პროტოკოლი იყენებს მონაცემთა გადაცემის დიდ გზას. ამიტომ, დიდი ენდიანის მეთოდს ქსელური ბაიტის რიგს უწოდებენ. როდესაც ორ ჰოსტს განსხვავებული ბაიტის ბრძანებით აქვთ კომუნიკაცია, ისინი უნდა გადაკეთდნენ ქსელის ბაიტის ბრძანებად, სანამ გაგზავნილ იქნებიან მონაცემები.

     

    4 გ .711
    ზოგადად PCM, ანალოგური სიგნალი გადის გარკვეულ დამუშავებას (მაგალითად, ამპლიტუდის შეკუმშვას), სანამ ციფრულდება. ციფრული მოხმარების შემდეგ, PCM სიგნალი ჩვეულებრივ დამუშავდება შემდგომში (მაგალითად, ციფრული მონაცემების შეკუმშვა).

     

    G.711 სტანდარტული მულტიმედიური ციფრული სიგნალის (კომპრესია / დეკომპრესია) ალგორითმია, რომელიც მახდენს პულსის კოდის ოტულაციას ITU-T– დან. ეს არის სინჯის აღების ტექნიკა ანალოგური სიგნალების ციფრული ფორმით, განსაკუთრებით აუდიოსიგნალებისთვის. PCM სიგნალს სინჯავს წამში 8000 ჯერ, 8KHz; თითოეული ნიმუში არის 8 ბიტი, ჯამში 64 კბიტი / წმ (DS0). შერჩევის დონის კოდირებისთვის არსებობს ორი სტანდარტი. ჩრდილოეთ ამერიკაში და იაპონიაში გამოიყენება Mu-Law სტანდარტი, ხოლო სხვა ქვეყნების უმეტესობა იყენებს A-Law სტანდარტს.

     

    A-law და u-law PCM– ის ორი კოდირების მეთოდია. A-law PCM გამოიყენება ევროპასა და ჩემს ქვეყანაში, ხოლო Mu-law გამოიყენება ჩრდილოეთ ამერიკაში და იაპონიაში. ამ ორ სხვაობას წარმოადგენს კვანტიზაციის მეთოდი. კანონი იყენებს 12 ბიტიან კვანტიზაციას, ხოლო კანონი იყენებს 13 ბიტიან კვანტიზაციას. სინჯის აღების სიხშირეა 8KHz და ორივე 8 ბიტიანი კოდირების მეთოდია.

     

    მარტივი გაგება: PCM არის აუდიო აპარატების მიერ შეგროვებული ორიგინალური აუდიო მონაცემები. G.711 და AAC ორი განსხვავებული ალგორითმია, რომლებსაც შეუძლიათ PCM მონაცემების შეკუმშვა გარკვეულ თანაფარდობამდე და ამით დაზოგონ გამტარობა ქსელის გადაცემაში.

     

     

     

     

    ჩამოთვალეთ ყველა კითხვა

    მეტსახელად

    Email

    კითხვები

    ჩვენი სხვა პროდუქტი:

    პროფესიონალური FM რადიოსადგურის აღჭურვილობის პაკეტი

     



     

    სასტუმრო IPTV Solution

     


      შეიყვანეთ ელ.წერილი სიურპრიზის მისაღებად

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> აფრიკული
      sq.fmuser.org -> ალბანური
      ar.fmuser.org -> არაბული
      hy.fmuser.org -> სომხური
      az.fmuser.org -> აზერბაიჯანული
      eu.fmuser.org -> ბასკური
      be.fmuser.org -> ბელორუსული
      bg.fmuser.org -> Bulgarian
      ca.fmuser.org -> კატალანური
      zh-CN.fmuser.org -> ჩინური (გამარტივებული)
      zh-TW.fmuser.org -> ჩინური (ტრადიციული)
      hr.fmuser.org -> ხორვატული
      cs.fmuser.org -> ჩეხური
      da.fmuser.org -> დანიური
      nl.fmuser.org -> ჰოლანდიური
      et.fmuser.org -> ესტონური
      tl.fmuser.org -> ფილიპინური
      fi.fmuser.org -> ფინური
      fr.fmuser.org -> ფრანგული
      gl.fmuser.org -> გალური
      ka.fmuser.org -> ქართული
      de.fmuser.org -> გერმანული
      el.fmuser.org -> ბერძნული
      ht.fmuser.org -> ჰაიტიური კრეოლური
      iw.fmuser.org -> ებრაული
      hi.fmuser.org -> ჰინდი
      hu.fmuser.org -> Hungarian
      is.fmuser.org -> ისლანდიური
      id.fmuser.org -> ინდონეზიური
      ga.fmuser.org -> ირლანდიური
      it.fmuser.org -> იტალიური
      ja.fmuser.org -> იაპონური
      ko.fmuser.org -> კორეული
      lv.fmuser.org -> ლატვიური
      lt.fmuser.org -> ქართული
      mk.fmuser.org -> მაკედონური
      ms.fmuser.org -> მალაიზიური
      mt.fmuser.org -> მალტური
      no.fmuser.org -> ნორვეგიული
      fa.fmuser.org -> სპარსული
      pl.fmuser.org -> პოლონური
      pt.fmuser.org -> პორტუგალიური
      ro.fmuser.org -> რუმინული
      ru.fmuser.org -> რუსული
      sr.fmuser.org -> სერბული
      sk.fmuser.org -> სლოვაკური
      sl.fmuser.org -> Slovenian
      es.fmuser.org -> ესპანური
      sw.fmuser.org -> სუაჰილი
      sv.fmuser.org -> შვედური
      th.fmuser.org -> Thai
      tr.fmuser.org -> თურქული
      uk.fmuser.org -> უკრაინული
      ur.fmuser.org -> ურდუ
      vi.fmuser.org -> ვიეტნამური
      cy.fmuser.org -> უელსური
      yi.fmuser.org -> Yiddish

       
  •  

    FMUSER უფრო მარტივად გადასცემს ვიდეოს და აუდიოს!

  • კონტაქტი

    მისამართი:
    No.305 ოთახი HuiLan კორპუსი No.273 Huanpu Road Guangzhou China 510620

    ელ-ფოსტა:
    [ელ.ფოსტით დაცულია]

    ტელ / WhatApps:
    + 8618078869184

  • კატეგორიები

  • საინფორმაციო ბიულეტენი

    პირველი ან სრული სახელი

    ელ-ფოსტა

  • paypal გადაწყვეტა  დასავლეთის გაერთიანებაბანკი ჩინეთის
    ელ-ფოსტა:[ელ.ფოსტით დაცულია]   WhatsApp: +8618078869184 Skype: sky198710021 ესაუბროთ me
    Copyright 2006-2020 Powered By www.fmuser.org

    დაგვიკავშირდით