vineri, 11 februarie 2011

Cap 2 - Muzica, banda sonora


Motto:

The piano teacher: Is music a part of your study ?
Charles: No, music is for my own pleasure.
                    
                        -- din filmul: Flowers for Algernon



De la filmul mut incoace paleta metodelor de a exprima  mesajul dorit include banda sonora. Aici sunt de lamurit mai multe concepte: frecventa, format de unda (wave - a dat .Wav), frecventa de esantionare, marimea in biti a esantionului. algoritmi de compresie, mp2, mp3 si alti termeni cum sunt: Raw Audio.

Dar sa ramanem la concret. Banda sonora a unui film era numita asa
din cauza faptului ca la pelicula de celuloid ea chiar asta era, o banda cu un zigzag alb/negru care era citit de o fotocelula, cam la fel cum acul de pick-up citeste un disc obisnuit, gravat cu acel(e) santulet(e) zimtat(e). Banda fiind o zona mai lata sau mai ingusta, lumina cazuta pe fotocelula varia iar variatia era amplificata si transformata in sunet.

Apropos: Stiti cate cercuri sunt pe un disc LP obisnuit ? Nu trisati !
Raspuns: Niciunul, este doar o enorma spirala.

La discul clasic, miscarea acului in santuletul discului era apoi transformata de un amplificator analogic in miscarea mebranei difuzoarelor. La film, variatia luminii producea sunetul. Metoda avea dezavantajul ca orice fir de praf picat in santurile discului si - la film - orice pata (sa zicem de la o musca sau un defect al pelicului) de pe banda sonora producea o miscare brusca a membranelor difuzoroarelor. Rezultatul, acele pocnete arhicunoscute de la ascultarea discurilor traditionale.

Sunt la fel de placute ca si un moment cand, alergand la vale pe panta unui deal,
te impiedici de o craca de copac, faci un salt, te ridici si cobori mai departe.

In schimb daca dealul ar fi avut scari si craca buclucasa ar fi stat pe o treapta
iar treptele ar fi destul de late, am cobori dealul practic fara probleme.

Aceasta este idea digitizarii sunetului: dealul curbei formei de unda este inlocuit cu o scara din trepte, si fiecare treapta e masurata precis. Mai corect au toate aceeasi lungime, chiar daca, din cauza pantei care variaza pot avea inaltimi relative usor diferite. (Aici puteti face un desen pe o foaie de hartie, daca simtiti ca trebuie.)

Dezavantajul: O asemenea descriere a pantei unui deal (a formei de unda), inlocuind-o cu o scara, pierde unele detalii, este adevarat. Din acest motiv melomanii harsaiti considera ca nimic nu reda mai bine armonicele instrumentelor de concert decat un disc analogic. Si au dreptate.

Avantajul: daca am proiectul arhitectural al scarii respective (o serie de cote ca pe un desen tehnic) pot reproduce mecanic si practic perfect, nu panta initiala, dar cel putin scara din desen. Deci se castiga la pastrarea fidelitatii (atat cat a fost ea inregistrata initial) prin copiere. Si toate copiile numerice sunt identice cu originalul.

Cam din acest motiv industria muzicala prefera sa copie discuri optice digitale: Cd-uri si DVD-uri si nu analogice. Ieftin si bun pentru mase. Din celalalt motiv, autorii de film de calitate filmeaza anaolgic pe pelicule de buna calitate (de la Kodak in sus.)

Totusi dezavantajul dispare cu cat "treptele" sunt mai fine. Ce inseamna mai fine ?
Pe de o parte mai scurte, (deci in termeni tehnici pe secunda de sunet sunt mai multe trepte - adica o frecventa mai mare de esantionare ) si inaltimile lor sunt mai precis masurate, cu o unitate mai fina, si dau numere mai mari (deci un esantion are mai multi biti in final, fiind un numar binar mai lung).

Asa am ajuns la parametriii INREGISTRARII audio digitale:
- frecventa de esantionare (la CD 44 KHz, dar la unele placi de sunet de computer se folosea 48 KHz) si
- numarul de biti ai esantionului: ex 16 biti adica numere de la 0 la 65535. Cam 65 000 de valori posibile pentru 16 biti. (2 la a 16-a este 65536 - inumltiti 2 x 2 x 2
de 16 ori daca nu credeti... ok, fie si cu un calculator de buzunar.

Atentie: Conversia de la esantioane inregistrate cu 44 KHz la cele cu 48 Khz se poate face dar afecteaza calitatea inregistrarii convertite. Daca se poate lucrati mereu cu acelasi frecventa de esantionare, sa zicem 44KHz.

De unde vine aceasta ? De la fizica. Urechea umana aude pina la circa 20 -22 Khz (la cei care aud tantarii ). Iar ca o sinusoida de aceasta sa fie cat de cat corect digitizata, ar trebui s-o impart macar in doua esantioane. Adica de o frecvanta de cel putin 2 ori mai mare: 20 Khz x 2 = 40 Khz. Si s-a ales mai mult: 44KHz.

48 de Khz ar fi mai bun ? Cu siguranta, dar ar scurta numarul de minute care incap pe un CD. Mai multe esantioane (numere) pe unitatea de timp, o capacitate fixa a discului 650 sau la altele mai noi circa 700MB => mai putine minute.

Sa ne facem un mic vocabular:
.Wav - de la wave, fisier de date cu forma de unda asa cum este ea esantionata, e formatul sunetelor de pe CD
     - Avantaj: calitate rel. mare, timp minim de procesare (CD-playere cu electronica simpla,ieftine si fireste   deducem usor ca practic  orice computer mai vechi o poate reda)
     - Dezavantaj: Fisiere lungi, volum mare de date. Incomod pentru calculatoarele cu DOS, WINDOWS care  folosesc formatul de fisiere FAT 16, ce permite doar fisier de 2GB maxim.
     - Aceasta problema o manifesta toate camerele de amator care functioneaza doar cu carduri FAT 16 si nu suporta carduri formatate altfel: EXT3 sau NTFS de exemplu. Detalii in capitolul despre medii de stocare, fisiere si pregatirea mediilor digitale pentru stocare. Tot acolo si problema (falsa) Apple versus Windows si celebra  intrebare cum sa -mi formatez cardul sau hard discul amovibil: FAT 16, FAT 32, NTFS, EXT3, EXT 4...etc. Dar sa nu divagam.

.mp2, .mp3
     - formate de fisiere comprimate, inventate in Germania la Fraunhoffer Institute (?? cum se scrie) sunt de fapt o mare pacaleala pentru urechea noastra.
     - ele nu sunt inregistrari adevarate ci sunete digitale care pentru urechea si creierul nostru SUNA LA FEL sau CAM LA FEL cu sunetul original.
     - Se bazeaza pe anatomia urechii... (capitol separat sau anexa care va fi ...) si pe ideea ca un sunet cu aceleasi frecvente sonore incluse in el va suna pentru ureche la fel. Aici pianistii v-ar spune ca arta tocmai consta in decalajul minuscul dintre sunetele  ce sunt pe partitura la acelasi tact, deci in defazarea lor.
     - Dar cum ascultatorii neantrenatii nu pot distinge interpretii ce canta la pian aceeasi partitura, nici ascultatorii de .mp3 nu pot distinge "inregistrarea .mp3" a unei formatii disco de muzica din concert. Dar daca comparati .Wav cu .mp3 diferenta se aude !!!
     - Avantaje pt .mp3: Format de mici dimensiuni, rezonabil pentru interviuri si muzica nepretentioasa, bun de transferat prin internet. Bun la stocat sute (nu doarzeci) de melodii pe un CD. Bun pentru banada sonora digitala finala a DVD -urilor ca si .mp2 mai des folosit.
       Suficient de bun pentru a copia vechi inregistrari audio analogice 20 Hz - 12 KHz, cum erau cele facute cu  vechile casetofoane rusesti.
     - Dezavantaj: Costul care il platiti pentru el odata cu fiecare: Windows (Da, e inclus in Windows si il platiti chiar daca nu-l folositi !   Si cam de asta e Winamp-ul gratuit! La fel si codecurile si cu fiecare player CD,DVD care suporta .mp3.

Dezavantaj: produce costuri de  productie iar solutiile "profesionale" (ce-o fi profesional intr-o muzica aproximativ inregistrata ca doar sa sune cam la fel ??) va scot bani din buzunar.

.ogg - Un format liber, inlocuitorul .mp3,ului, nu are dezavantajele acestuia. Ca producator individual de audio video il puteti folosi fara restrictii si fara taxe, codecurile sunt libere, software-ul e liber, vom avea intotdeauna unelte sa prelucram asa o inregistrare.

Retineti:  Aici se mai face  o confuzie ! OGG nu e numele codecului. OGG este doar numele containerului care-l contine. De fapt numele codecului este        Vorbis. Corect e sa ne gandim la codare Vorbis in container OGG asa cum ne gandim la codare .mp3 pt banda sonora din containerul .avi la un film descarcat din internet.

Recomandare: Pastrati banda sonora in format: .wav pentru calitate si .ogg pentru compatibilitate si dimensiune. Colectiile de codecuri includ
si decodorul .ogg - doar e gratuit !!! "rip-aiti" CD-urile in format .ogg si .wav nu .mp3. Cei care au vrut sa salveze .mp3 din programe ca Audacity stiu ca e nevoie de o biblioteca cu un "codor" (nu decodor) care nu e permis sa se distribuie gratuit...

Nota: Unele softuri nu pot calcula perfect corect la ce secunda va ajunge byte-ul cutare sa fie cantat, mai ales ca la unele codari / codecuri rata de transfer a numerelor produse prin codare variaza. O liniste monotona produce mai putini bytes ca o dezlantuire orchestrala de 85dB de exemplu.
Pentru o sincronizare buna intre video si audio lucrati cu .wav, chiar daca este mult mai lung. Altfel veti observa desincronizari intre video si audio la proiectele mari, de durata.

.mid - nu sunt sunete ci mai degraba partituri electronice (echivalentul modern al cilindrului de flasneta) care sunt cantate  pe loc de adevarate orchestre ascunse in cipurile placilor de sunet cu capabilitati midi sau de software. Anumite sintetizatoare pot sa cante asemenea partituri. Se pot realiza cu programe numite "sequencere midi" cum este RoseGarden, dar treaba asta este pentru muzicieni. Si aici e curios ca unii cumpara sequencere midi, cand de fapt ele nu sunt decat un fel de "perforatoare de cartele" mai sofisticate.
     - Midi e adevarata muzica orchestrala electronica. Bineinteles o placa de sunet Yamaha care are stocate in ea formele sunetelor de  la o orchestra de instrumente de lux va canta altfel ACEEASI partitura - midi - decat alt Sound Card. Daca doriti sa ascultati .mid, sa inregistrati analogic muzica stfel produsa (sau chiar digital) o placa de sunet de calitate se impune. Yamaha !
     - Mid nu este un codec.
  
Functie de cat de rapid e aparatul care "reproduce" muzica cu atat mai mult putem comprima banda sonora.

Cd-player-ul are practic nevoie de .Wav-uri. DVD-playerele moderne se descurca si cu .mp2 si .mp3 (n-am incercat cu .ogg )
la fel si TV-urile de ultima generatie (acele "plasme" cu port USB). Computerele se descurca practic cu oricare din formate. Nu uitati sa instalati un pachet de codecuri corespunzator dotat (la Windows) sau GStreamer-ul la Linux. Profesionisti care lucreaza cu Linux pot cumpara codecuri garantate de la e-magazinul Fluendo. (Si il puteti descarca pe cel pt. .mp3 -uri gratis :) tot de acolo.

Nota It-istului: Candva computerele aveau procesoare lente si hard discuri lente. Acum au procesoare rapide si hard discuri lente.
Ce inseamna asta ? Ca acum putem procesa,mixa mai usor formatele comprimate: .mp3, .mp2, .ogg si altele mai vechi. In schimb cu codecuri noi cum e H264  computerele vor avea de lucru, cer putere mare de calcul dar comprima, nu gluma. (mda, H264 e de fapt codec video dar ideea e aceeasi, compresie puternica = putere de calcul mare = spatiu ocupat mai mic + ceva pierdere de calitate.)

Codare/decodare: Preferabil sa lucrati cu formate necomprimate decat sa comprimati si sa decomprimati tot timpul unui proces de editare
audio/video. Se pastreaza calitatea care altfel ar putea fi alterata de unele compresii/decompresii. Deci in .mp3 (sau altceva) convertim la sfarsit.

.raw - date audio brute, deci tot necomprimate. Nume generic dat datelor audio pentru care alt dispozitiv se va ocupa de procesare.

Acest capitol nu epuizeaza codecurile existente dar va invata printre altele:
1. Sa deosebiti .wav de .ogg si .mp2,.mp3 si altfel decat prin nume
2. Sa intelegeti ce avantaje si dezavantaje au.
3. Sa intelegeti unde veti pierde pe termen lung si sa va fereasca de decizii incorecte.
4. Ca institutiile publice, platite din bani publici nu ar trebui sa foloseasca codecuri proprietare (.mp3 de exemplu) si sa cheltuie banii contribuabililor blocand informatia in formate proprietare dar problema nu este pe departe asa de simpla.

Tema: Copiati pe CD-uri / DVD-uri diverse fisiere audio si testati daca playerul Cd/DVD din dotare le
poate folosi cu succes. Ce se intampla cand puneti fisierele in directoare ?

Tema: Dezbateti daca este corect ca o institutie publica asa cum este TVR trebuie sa foloseasca codecuri proprietare sau nu. Incepeti de la faptul ca atunci cand cunparam Windows platim in avans si codecurile pe care nu le folosim iar cand descarcam Linux nu cumparam codecurile sau nu le avem sau - mai rar - unii le cumpara. Cum este mai bine ?

Tema: Cautati pagina unui film pe internet si cititi specificatiile tehnice privitoare la banda sonora.
Ce ati putut descifra de acolo ? Ce codec s-a folosit ? Este public sau proprietar ?

Tema: ascultati un disc de vynil original, un CD matritat original, un fisier .mp3, unul .wav si unul .ogg  cu aceeasi melodie (se obtin prin "r?ipping" cu asa numitele programe Ripere). Ce ati observat ? Care reda cel mai bine armonicele sonore ? Care reda artefacte sonore (sunete care nu existau) ? Deosebiti .wav-ul de .mp3 dupa sunet ? Dar dupa lungimea fisierului ?

Tema: Ascultati un .ogg cu Winamp sub Windows ? Ce concluzie trageti ? Stiati ca Winamp-ul stie si formatul .ogg Vorbis  si nu e doar pentru .wav si .mp3 -uri ?




------------------------------------------
Aici mai pot fi multe de spus despre muzica:
- Sa folositi Audacity (un Sound Forge gratuit pentru a face inregistrari si copy - paste-uri muzicale ori alte procesari sau
- Sa folositi  LMMS - un software puternic de sinteza muzicala.)
- despre alte softuri libere si mai putin libere.
------------------------------------------

Rog nu distribuiti aceasta pagina.
Author PD


P.S. Fiindca m-am gandit sa va ofer cat mai des cate un clip, atasez unul, facut folosind Linux.  Este un efect standard care descompune si recompune o imagine data. Video autorii il pot avea in vedere pentru, cine stie, un generic, o tranzitie intre doua parti ale unei emisiuni sau dupa gust, functie de imaginea transformata.
Muzica este din setul de demo-uri al programului LMMS - Linux Multi Media Studio iar efectul il gasiti in colectia de ... va spun la o lectie viitoare, daca realmente nu l-ati observat niciodata.

Niciun comentariu:

Trimiteți un comentariu