Forsida

Temaer

Sjangere

mp3 skader musikken din

Snarveier:
[ « Forrige ] [ Neste » ]

Tema: Programvare; sjanger: Meninger
Skrevet av Andreas Nordal den 22. november 2009 kl 01:00:48; Kommentarer: 4

mp3 vs FLAC (audacity)
Dette skjer med musikken din når du lagrer den som mp3: Forskyvning fra starten og pause i overgangen mellom sangene. Det er lett å se og lett å høre!

Ryktene skal ha det til at det i praksis er vanskelig å høre kvalitetsforringelsen som oppstår når man lagrer lyd i mp3-formatet. De som mener dette har tydeligvis ikke tatt i betraktning mp3-formatets akilleshæl. Hvis du tester dette selv, tror jeg du vil være enig med meg i at man skal være 100% døv for å ikke høre forskjellen. Jeg forutsetter da at mp3-dekoderen ikke prøver å maskere problemet ved å mikse overgangene sammen.

Slik testet jeg

  1. Kjøpte Goliath 12 på CD.
  2. Rippet hvert spor av CD-en til FLAC.
  3. Hentet ut slutten av spor 8 (Rank1 - It's up to you) og starten av spor 9 (Thrillseekers - Synaesthesia) med Audacity og lagret som 8.wav og 9.wav.
  4. lame -b 128 -f 8.wav -o 8.mp3
    lame -b 128 -f 9.wav -o 9.mp3
    oggenc -q -1 8.wav -o 8.ogg
    oggenc -q -1 9.wav -o 9.ogg
  5. Satte sammen 8.wav og 9.wav i Audacity. I et nytt stereospor under satte jeg sammen 8.mp3 og 9.mp3. Etikettesporet nederst markerer hvor mp3-filene skjøtes sammen. Skjermbildet ser du til høyre.
  6. Zoomet inn på overgangen mellom 8.wav og 9.wav og Tok skjermbilde. Gjorde det samme med 8.ogg og 9.ogg. Disse skjermbildene la jeg oppå hverandre med det øverste vinduet gjennomsiktig, og tok skjermbildet FLACerBestOgVorbisErLikeBra.png.

Forklaring til bildene

Bildene er skjermskudd fra lydredigeringsprogrammet Audacity, og viser skjøten mellom 2 sanger i forskjellige lydformater. All lyd i denne testen er i stereo, det vil si at hvert par av det som kanskje likner på separate lydspor, egentlig henger sammen som ett stereospor, der øverste spor styrer venstre høyttaler. At de henger sammen er synlig i det høye bildet til høyre (som er snudd på høykant for å få plass). Stereosporet som her var øverst er originalen, mens mp3 var under (nå: venstre).

FLAC er best, men Vorbis like bra

Som bildet nedenfor viser, passer lydbølgene fra slutten av den første sangen sammen med lydbølgene til den neste. Jeg kan forsikre at det også hørtes slik ut, dvs. overgangen var umerkelig. Det gjelder både wav- og ogg-filene. Nå lurer du kanskje på hvorfor jeg omtaler wav som flac, men wav-filene er bare ekstrakter av flac-filene som jeg rippa. Siden det er kvaliteten vi snakker om, er disse formatene ekvivalente (Wav er ukomprimert og FLAC er en tapsfri kodek). Siden alt stammer fra flac-filene, kan jeg konkludere med at overganger mellom sanger blir perfekt bevart når man ripper en CD til FLAC.

overgang mellom 2 sanger, FLAC vs Vorbis
Nærbilde av overgangen, fra øverst til nederst:
Venstre kanal, FLAC
Venstre kanal, Vorbis
Høyre kanal, FLAC
Høyre kanal, Vorbis

Den store over­raskelsen var Ogg Vorbis' over­legenhet over mp3. Mens mp3-filene ble kodet med 128 kb/s, noe som er ganske typisk, ble ogg-filene kodet med laveste kvalitetsnivå (-1), noe som resulterte i henholdsvis 54,4 og 56,2 kb/s. Ingen ville finne på å kode mp3 med så lav bitrate (bortsett fra youtube tenker jeg), og jeg skal innrømme at kvaliteten ble hørbart dårligere, men like fullt: Ikke en plancktid glipp i overgangen mellom sangene med Ogg Vorbis. Med tanke på at både Vorbis og mp3 bygger på diskret kosinustransformasjon, ble jeg litt overrasket, selv om alle vet at Ogg Vorbis er bedre enn mp3. Uansett er det viktigste for meg å unngå glipp i over­gangen mellom sangene. Det er, i motsetning til all annen snikk­snakk om lydkvalitet, så påfallende at man skvetter til selv om man ikke hører godt etter eller er i støyende omgivelser.

mp3-formatets akilleshæl

  1. Tidspunkt for start og slutt er udefinert
  2. Pre-ekko og post-ekko skaper grums henholdsvis på starten og slutten. Dette skyldes at komprimeringsalgoritmen, diskret kosinustransformasjon, ikke takler skarpe kontraster. Det er også derfor skarpe kontraster i et JPG-bilde blir grumsete.

Resultatet er at hele lydfila blir lenger enn den skulle vært, og at det er umulig å gjette presist hvor den egentlig skulle ha starta og slutta. Noen dekodere er bedre til å gjette enn andre; det som høres bra ut på musikkspilleprogrammet ditt, er kanskje noe annet for CD-brenneprogrammet for eksempel. Heldigvis for meg, gjettet Audacitys dekoder dårlig nok til at jeg fikk demonstrert fenomenet med disse bildene.

OPPDATERING 13. desember 2009 05:20
Fenomenet har (tydeligvis) ikke noe med bitrate å gjøre: Jeg ville undersøke hvordan mp3 med grisehøy bitrate takler overganger mellom sanger. Bitraten ble dessverre maksimalt 320 kb/s med lame (selv om jeg ba om 1000 kb/s). Den største filstørrelsen lame ville gi meg, fikk jeg med "lame --preset insane". Resultatet ble at med 320 kb/s mp3, fikk pre- og post-ekkoene stort sett så lave amplituder at de ikke syns på bildet (lavere enn et piksel), men like fordømt: Glippen i overgangen har akkurat like lang varighet.

Trykk på bildene nedenfor for å kikke nærmere på saken:

Audacity post-ekko (mp3) pre-ekko (mp3)

Derfor skal du rippe til FLAC

FLAC er tapsfritt, så ripper du en CD til FLAC, kan du trygt knekke den etterpå. FLAC tar vare på metadata, i motsetning til wav. Hvis tapsfri kompresjon ikke er tingen for deg, husk at alt (unntatt mp2) er bedre enn mp3. Som eksempel har jeg vist at Ogg Vorbis fungerer fortreffelig i overgangen mellom to sanger, mens mp3 er totalt udugelig på dette. Hvis du skulle finne på å brenne en lyd-CD, sørg for å bruke "disc at once"-modus (DAO), og ikke "track at once" (TAO). Det siste fører til 2 sekunders pause mellom hvert spor.

Kommentarer (4)

Imre - 27. november 2009 kl 02:24:04

Ante ikke dette med at det blir glipper på start og slutt av sporene. Har ikke merket noe til dette selv, sikker på at du bruker riktige innstillinger i LAME?
Hva grums og slikt angår: Såklart blir det rævva lyd ved 128kbps. Prøv deg med V0 og V2 du. ;)
Andreas Nordal - 28. november 2009 kl 22:50:31

Jeg er bombesikker. Jeg har årevis med erfaring i å bruke Audacity til å redigere bort pausene fra mp3-musikk som jeg ikke får tak i på CD, så dette er ikke noe som tilfeldigvis oppsto i denne testen. Derimot er jeg vant til at pausen på slutten varer mye lenger enn den gjorde her, og at den normalt overgår pausen på starten. Jeg vil gjerne at folk tester litt selv også, så de får erfare nøyaktig hvor dårlig mp3 er.

Denne testen var ren empiri. I ettertid fant jeg en wikipedia-artikkel som kan forklare resultatene mine.

Et testresultat jeg unnlot å nevne var at lame klarer å fjerne pauser fra sine egne mp3-filer ved dekoding. Jeg sjekka ikke hvor bra overgangen ble. Ifølge wikipedia er det fordi lame lagrer spesielle metadata om hvor mye som skal klippes av. Selve pausen blir altså like forbannet lagra, og mp3 er på ingen måte egnet for pausefri avspilling.

For å avkrefte din mistanke, vil jeg med tid og stunder komme med en oppdatering som viser hvordan mp3 med grisehøy bitrate fortsatt gruses av Ogg Vorbis i overganger. Jeg tok nettopp en kjapp høretest i 1000 kbps, og tror jeg hørte forskjell.
Vaseline - 3. desember 2009 kl 05:08:47

Mp3 er jo SÅ ut; det er mp4 som RULER!
Andreas Nordal - 6. desember 2009 kl 19:25:36

Nei, mp4 (AAC) suger det også. Vennligst les http://en.wikipedia.org/wiki/Gapless_playback#Format_support.

Skal man lagre et lydklipp slik at lengden er entydig gitt eksakt lik originalen, er det enten tapsfri kompresjon, eller Musepack, Ogg Vorbis/Speex, eller WMA (visstnok) som gjelder.

Din kommentar

Navn:
[url] og [url tekst] kan brukes for å lage lenker.
Gjenta: VIRKER IKKE