Leia mais sobre as configurações de conversão de som. O que é bits? Como eles afetam a qualidade da música e vídeo? O que é melhor que 128 ou 320 kbps

Você já se perguntou o que exatamente é perdido quando comprimido de sem perdas em MP3 128 Kbps ou 320 kbps?
Eu verifiquei e o resultado parecia interessante. Primeiro de tudo, proponho uma pesquisa para entender por si mesmo para saber se a diferença é em geral. Se você não tem certeza de que ouve ou confiante de que você não ouve, eu proponho uma ideia simples e elegante à sua atenção: você precisa tomar duas testa dois ondas sonoras Um dos quais estará na antiphase, respectivamente, na informação das duas faixas, será vantajosamente audível o que não é resgatado. Gráficos interessantes ainda não prometem, mas você pode se ouvir em nosso sistema que tipo de sons são perdidos quando comprimidos do flac em mp3 128 \\ 320 kbps, um arquivo com exemplos no final do artigo.
Entrevista
Você precisa baixar e ouvir 12 faixas por 30 segundos. Em seguida, para especificar para cada uma das 4 composições uma das 3 opções (128 Kbps, 320 kbps ou sem perdas).
A pesquisa é anônima, mas você pode especificar um hash único e dizer para mim, como último recurso, publique sua opinião aqui, mas necessariamente sob o spoiler. A pesquisa durará até 25.02, após a chave e estatística.
Arquivos no disco yandex, espelho no Dropbox (~ 80MB).
Dados iniciais
As teclas pretas - luz eterna (FLAC, 44100 Hz, 24 bits, 1613 Kbps), você pode ler YouTube..
Ludovico Einaudi - Drop (Flac, 96000 Hz, 24 bits, 2354 Kbps), você pode ler Yandex Music.
CC Coletti - Rock and Roll (FLAC, 192000 Hz, 24 bits, 4845 Kbps), você pode ler em YouTube..
Annihilator - ultra-movimento (FLAC, 44100 Hz, 16 bits, 1022 Kbps), você pode ler em YouTube..
Parâmetros de conversão em MP3
44.1khz, estéreo, 128 kbps ou 320 kbps
Descrição do experimento
Os arquivos de origem são cortados em pedaços de 10 segundos, cada uma das peças é exportada para WAV. Depois de importar as faixas obtidas para o início de cada um, 2 segundos de silêncio e um segundo sinal de tom são adicionados e, em seguida, convertidos em MP3. Depois de importar arquivos MP3, ela é relativa ao original, o arquivo resultante "foi em frente". Isso não é um bug, é. Realizamos a sincronização com relação ao sinal de tom especificado do original (eu tentei para cada arquivo MP3 vários valores, que subseqüentemente esclarecidos com o melhor resultado), livrar-se do sinal de tom, o silêncio e os negócios obtidos são exportados para WAV. Agora resta inverter as faixas para obter picos multidirecionais e reduzir o original.
Resultado
Eu não vou abrir a América ... Sim, há uma diferença. Sim, especialmente quando comprimido para 128kbps. Sim, depende da música. Sim, ainda mais do código de áudio.
Faça uma saída independente e ouça a diferença que você pode baixar os arquivos

Hoje em dia, há muitas conversas que perdemos música real com a chegada de formatos de áudio compressiva, como MP3, AAC e similares. É verdade? Os formatos sem perdas vão economizar? Um ouvinte despreparado pode distinguir a música em formatos MP3 do flac? Vamos descobrir neste assunto.

O que é taxa de bits (taxa de bits)?

Provavelmente você já ouviu o termo "bitrate" antes, e você provavelmente tem uma idéia geral do que isso significa, mas talvez não seja ruim se familiarizar com sua definição oficial para que você saiba como tudo funciona.

Taxa de bits. - Este é o número de bits ou quantidade de dados que são processados \u200b\u200bdurante certo período Tempo. Em áudio, isso geralmente significa kilobit por segundo. Por exemplo, a música que você compra no iTunes é de 256 kilobit por segundo, ou seja, cada segunda música contém 256 kilobytes de dados.

Quanto maior a taxa de bits do caminho, mais espaço ele terá no seu computador. Como regra, o CD de áudio leva um bom espaço, por isso tornou-se prática normal para compactar esses arquivos para que você possa gravar mais música para o seu hDD. (ou iPod, Dropbox ou outra coisa). É aqui que os formatos "sem perdas" e "com perdas" entram em disputa.

Formatos sem perdas e com perdas: Qual é a diferença?


Quando dizemos "sem perda", queremos dizer que realmente não alteramos o arquivo de origem. Ou seja, copiamos a faixa do CD para o nosso disco rígido, mas não apertou isso a tal ponto que perdemos quaisquer dados. Isso é essencialmente o mesmo que a faixa de CD original.

No entanto, na maioria das vezes você provavelmente copia sua música no formato perdido. Ou seja, você pegou um CD, copiou para o disco rígido e apertou as faixas para que eles não ocupem muito espaço. Um álbum típico provavelmente leva 100 MB ou mais. O mesmo álbum em um formato de perda, como (também conhecido como Apple Lossless), levará cerca de 300 MB, por isso tornou-se uma prática comum para usar formatos de perda para mais download rápido e maior economia de disco rígido.

O problema é que quando você aperta um arquivo para economizar espaço, você exclui dados. Assim como quando você assume uma imagem de alta qualidade, e comprima-a no JPEG, seu computador leva os dados de origem e "enganar" certas partes da imagem, tornando-a principalmente a mesma, mas com alguma perda de clareza e alta qualidade.

Como exemplo, tire duas imagens abaixo: A direita certa é claramente comprimida e, como resultado, a qualidade diminuiu.

Lembre-se de que você salva um espaço de disco rígido espremendo música em formatos perdidos, que pode ser de grande importância para o iPhone com 32 GB de memória, mas de acordo com a quantidade de volume / qualidade é apenas um compromisso.

Existem vários níveis de compressão: 128 Kbps, por exemplo, ocupam muito pouco espaço, mas também terá uma qualidade de reprodução baixa do que um arquivo de 320 kbit / s maior, que, por sua vez, é menor que a qualidade do que o arquivo de referência com 1.411 Kbps. 1.411 Kbps é a qualidade do nível de CD de áudio, que, na maioria dos casos, é mais que suficiente.

O problema todo não é quanta música é comprimida, mas em qual equipamento você ouve.

A taxa de bits é realmente importa?


Como a memória todo ano se torna mais barata, ouvindo som com uma taxa de bits mais alta, ou em formatos sem perdas, começa a se tornar cada vez mais popular. Mas vale a pena, esforço e memória ocupada em seu telefone ou computador?

Eu não gosto de responder a perguntas dessa maneira, mas infelizmente, a resposta é: depende.

Parte da equação é o equipamento que você usa. Se você usar um par de fones de ouvido ou alto-falantes de alta qualidade, está acostumado a uma grande frequência e faixas dinâmicas. Assim, você provavelmente notará as deficiências que ocorrerão ao compactar a música em arquivos com uma taxa de bits inferior. Você pode notar que em arquivos MP3 de baixa qualidade não há determinado nível de detalhe; Trilhas finas de fundo podem ser mais difíceis para a percepção, as freqüências superiores e baixas não serão tão dinâmicas, ou você pode ouvir distorções no vocal do soluito. Nestes casos, você pode precisar de uma faixa com uma taxa de bits mais alta.

No entanto, se você ouvir sua música usando um par de fones de ouvido baratos no seu iPodVocê provavelmente não notará a diferença entre o arquivo de 128 kbps e o arquivo de 320 kbit / s, para não mencionar a música sem perda de 1,411 kbps. Lembre-se quando eu mostrei a você um parágrafo múltiplo acima e observou que você provavelmente tinha que estar olhando para ver as deficiências? Seus fones de ouvido são como uma versão truncada da imagem: eles farão essas desvantagens difíceis para a percepção, pois são fisicamente capazes de tocar música conforme necessário.

Outra parte da equação, é claro, seus próprios ouvidos. Algumas pessoas podem ser muito difíceis de distinguir duas taxas diferentes por uma simples razão - elas ouvem uma pequena música. Habilidade auditiva, como qualquer outra, desenvolve-se com a prática. Se você costuma ouvir muitas de suas músicas favoritas, seu boato se torna mais preciso e começa a capturar pequenos detalhes e de meio-tom. Mas até então não importa o bitrate que você usa?

Então, qual formato e taxa de bits você tem que escolher por si mesmo? Você terá 320 kbps, ou você precisa de um formato sem perdas?

O fato é que é difícil ouvir a diferença entre o arquivo de perda e o arquivo MP3 320 Kbps. Para ouvir a diferença, você precisará de um equipamento grave de alta qualidade, boa audição e um certo tipo de música (por exemplo, clássico ou jazz).

Para a esmagadora maioria das pessoas, 320 kbps / com mais do que suficiente para ouvir.

O que mais levar em conta?


Música, gravada, pode ser útil. Arquivos em formato sem perdas são mais confiáveis \u200b\u200bno futuro, no sentido de que você pode sempre apertá-los ao formato perdido quando você precisar, mas não pode fazer pelo contrário e restaurar a qualidade do CD original do arquivo MP3. Isso, novamente, um dos problemas fundamentais com lojas de música online: Se você criou uma enorme biblioteca de música no iTunes e um dia decidiu que você precisa de mais taxa de bits, você terá que comprá-lo novamente, mas apenas desta vez no formato de CD.

Quando é possível, eu sempre compro ou copio música em formato sem perdas para fins de backup.

Eu entendo que audiófilos, é como uma agulha em unhas. Como eu disse, tudo depende de você, sua audição e equipamento que você tem.

Compare duas faixas registradas em formatos sem perdas e perdas. Tente vários formatos de áudio diferentes, ouça seu tempo e observe se haverá uma diferença para você ou não.

No pior dos casos, você passa algumas horas ouvindo sua música favorita - não tão assustadora, certo? Aproveite!

Prós e contras MP3 128 Kbps

A compactação de dados de áudio é uma coisa complicada. Nada pode ser dito com antecedência ... O formato mais comum para hoje é MPEG Layer3 com um fluxo de 128 kbps - fornece qualidade que à primeira vista não é diferente do original. Também é chamado frívola - "qualidade de CD". No entanto, quase todo mundo sabe que muitas pessoas são portão do nariz dessa "qualidade de CD". O que está errado? Por que essa qualidade não é suficiente? Pergunta muito difícil. Eu sou um adversário de compressão de 128 kbps, já que o resultado é às vezes um estúpido. Mas eu tenho vários registros em 128 kbps, para o qual praticamente não consigo encontrar falhas. Se o fluxo 128 é adequado para codificar um ou outro material - aparece, infelizmente, apenas após ouvir repetidamente o resultado. Não é possível dizer qualquer coisa com antecedência - pessoalmente não conheça os sinais que permitiriam antecipadamente determinar a com sucesso do resultado. Mas muitas vezes o fluxo 128 é completamente suficiente para codificação de música de alta qualidade.

Para codificar em 128 kbps, é melhor usar produtos de Fraunhofer - MP3 produtor 2.1 ou posterior. Além de Mp3enc 3.0 - tem um erro irritante que leva a codificação de alta frequência muito ruim. Versões acima 3.0 não sofrem dessa desvantagem.

Primeiro de tudo, um pouco de palavras gerais. A percepção da imagem sadia por uma pessoa depende muito da transmissão simétrica de dois canais (estéreo). Diferentes distorções em diferentes canais - muito pior que o mesmo. De um modo geral, garantindo tanto quanto possível características sonoras em ambos os canais, mas material diferente (Caso contrário, o que um estéreo) é um grande problema de gravação de som, que geralmente é subestimado. Se pudermos usar 64 kbit / s para codificar mono, então para codificar estéreo em simplesmente dois canais, não teremos 64 kbps por canal - o resultado estéreo soará muito mais incorreto do que cada canal separadamente. Na maioria dos produtos Fraunhofer, o limite para mono é de 64 kbps - e ainda não vi um registro mono (registro limpo - sem ruído ou distorção), o que exigiria um fluxo maior. Por alguma razão, nosso vício em som monofônico é muito mais fraco do que para estéreo - aparentemente, ele simplesmente não é percebido por nós seriamente :) - De um ponto de vista psicoacústico, é simplesmente um som de saída da coluna, e não tente completar algumas fotos de som.

Uma tentativa de transmitir sinais estéreo faz requisitos muito mais rigorosos - no final, você já ouviu falar de um modelo psicoacústico que leva em conta o mascaramento de um canal para os outros? Alguns inversos também são ignorados, por exemplo, os efeitos - por exemplo, um efeito estéreo projetado para ambos os canais imediatamente. Separadamente tomado canal esquerdo mascara sua própria parte do efeito - não vamos ouvir isso. Mas a presença do canal direito é a segunda parte do efeito - muda nossa percepção do canal esquerdo: Nós subconscientemente esperamos ouvir a parte esquerda do efeito, e essa mudança de nossa psicoacústica também deve ser considerada. Com uma fraca compressão - 128 kbps em um canal (total de 256 kbps), esses efeitos estão se aproximando, já que cada canal é apresentado bastante para se sobrepor a necessidade de simetricidade de transmissão, mas para threads cerca de 64 kbps no canal é um grande Problema - A transferência de nuances finas da articulação A percepção de ambos os canais requer transmissão mais precisa do que hoje é possível em tais fluxos.

Claro, foi possível fazer um modelo de alto-falante completado para dois canais, mas a indústria passou por outro caminho, que é geralmente equivalente a isso, mas muito mais fácil. Muitos algoritmos com o nome geral da solução parcial de som conjunta dos problemas descritos acima. A maioria dos algoritmos é reduzida ao fato de que o canal central e o canal de diferença são alocados - Mid / Side Stereo. O canal central carrega as principais informações de áudio e é um canal mono regular formado a partir de dois canais de origem e a diferença no restante das informações que permite restaurar o som estéreo original. Por si só, esta operação é completamente reversível - é apenas outra maneira de representar dois canais, com os quais é mais fácil trabalhar ao compactar informações estéreo.

Além disso, geralmente comprime a compressão de um canal central e de diferença separado, enquanto o uso do canal de diferença na música real é relativamente pobre - ambos os canais têm muito em comum. O equilíbrio de compressão em favor do canal central e de diferença é escolhido em movimento, mas principalmente um fluxo muito maior se destaca ao canal central. Algoritmos complexos decidem que estamos em este momento É preferível - uma imagem espacial mais correta ou a qualidade de transmissão comum aos canais de informação, ou simplesmente compressão sem estéreo médio / lateral - isto é, no modo de canal duplo.

Estranhamente, a compressão estéreo é o lugar mais fraco de compressão resulta em Layer3 128 Kbps. É impossível criticar os criadores do formato - ainda é um pouco mal possível. A informação estéreo fina quase não é percebida conscientemente (se você não levar a atenção de coisas óbvias - o layout grosseiro dos instrumentos no espaço, efeitos artificiais, etc.), então a qualidade do estéreo é estimada por uma pessoa por último. Normalmente, algo sempre não permite chegar a isso: colunas de computador, por exemplo, fazer desavantagens muito mais substanciais, e a tais sublocações à medida que a transmissão errada de informações espaciais simplesmente não está atingindo.

Não é necessário pensar que o que não permite ouvir essa falta de acústica de computador é que as colunas são organizadas a uma distância de 1 metro, nas laterais do monitor, sem criar um tóxico estéreo suficiente. O ponto não é mesmo nisso. Em primeiro lugar, se se trata de tais colunas, o homem fica bem na frente deles - e cria o mesmo efeito que as colunas nos cantos da sala, e ainda mais: em acústica normal e bom volume você quase você nunca pode destacar a localização espacial exata dos sons (não é sobre a imagem sadia, que, pelo contrário, os alto-falantes de computador nunca serão construídos, mas sobre a percepção direta, consciente, percepção entre os canais). Colunas de computador (uso padrão) ou fones de ouvido dão uma percepção direta muito mais clara de estéreo do que a acústica musical comum.

Confiável a dizer - para a percepção sonora direta e informativa, não somos informações estéreo precisas muito necessárias. Detectar diretamente a diferença neste aspecto entre o original e a camada de 128 kbps bastante difícil, embora seja possível. Precisa de muita experiência, ou fortalecer os efeitos do interesse. A coisa mais simples que pode ser feita é praticamente disseminar os canais mais longe do que é possível fisicamente. Geralmente é esse efeito que liga em barato técnico de informática Botão de som 3D. Ou em caixas de lança cujas colunas não são separadas do corpo do dispositivo e são muito fracas para transmissão de um belo estéreo caminho natural. Há uma transição de informações espaciais em informações específicas de áudio de ambos os canais - a diferença entre os canais aumenta.

Eu apliquei um efeito mais forte do que geralmente é aceito para ouvir melhor a diferença. Veja como ele deve soar - depois de codificar em 256 kbps com um canal duplo (256_channels_wide.mp3, 172 KB), e como ele soa após codificação em 128 kbps com estéreo articulado (128_channels_wide.mp3, 172 KB).

Retiro. Ambos os arquivos são mp3 de 256 kbps, codificados usando o produtor mp3 2.1. Não confunda: eu, primeiro, teste MP3 e em segundo lugar - poste os resultados do MP3 Testing MP3;). Foi tudo assim: no começo eu codificei a passagem da música em 128 e 256. Em seguida, dividimos esses arquivos, processamento aplicado (expansor estéreo), espremido em 256 - apenas para economizar espaço - e desativado aqui.

By the way, apenas a 256 kbps no MP3 produtor 2.1 desliga estéreo conjunta e liga-se em canais duplos - dois canais independentes. Mesmo 192 kbps no produtor 2.1 é algum tipo de estéreo conjunto, porque meus exemplos foram muito incorretamente comprimidos em menos de 256 kbps. Esta é a principal razão pela qual a qualidade "completa" começa com 256 kbps - historicamente desenvolvida que qualquer fluxo menor em produtos comerciais padrão de Fraunhofer (até 98 anos) é o estéreo conjunto, que em qualquer caso é inaceitável para a transmissão totalmente correta. Outros produtos (ou atrasados), em princípio, permitem que você escolha arbitrariamente - articulação estéreo ou um canal duplo - para qualquer linha.

Sobre resultados

No original (que este caso É precisamente 256 kbps) ouvimos um som com um canal de diferença reforçado e enfraquecido central. Muito bem, foi ouvido um reverb de voz, como em geral, todos os tipos de reverb artificiais e eco - esses efeitos espaciais são principalmente no canal de diferença. Para falar especificamente, neste caso havia 33% do canal central e 300% de diferença. O efeito absoluto é 0% do canal central - liga no tipo de equipamento centros de música. "Fader vocal de karaokê", "Cancelamento de voz / remoção" ou similar, o significado de que é remover a voz do fonograma. O significado da operação é que a voz é geralmente registrada apenas no canal central - a mesma presença no canal esquerdo e direito. Removendo o canal central, removemos a voz (e muito mais, então esse recurso em vida real Bastante inútil). Se você tem uma coisa dessas - você pode ouvir o seu MP3 com ele - um detector de estéreo conjunto engraçado é obtido.

Neste exemplo, você já pode entender indiretamente que perdemos. Primeiro, tornou-se visivelmente pior do que todos os efeitos espaciais - eles apenas perderam. Mas no segundo - bouffagon é o resultado da transição de informações espaciais em som. O que correspondia no espaço - sim, apenas o tempo quase movendo os componentes sonoros aleatoriamente, um certo "ruído espacial", que não estava no fonograma original (ele pode suportar pelo menos a transição de informações espaciais em sírio sem a aparência de efeitos). Sabe-se que este tipo de distorção ao codificar em fluxos baixos muitas vezes aparece e diretamente, sem qualquer tratamentos adicionais. Apenas uma distorção de som imediata (quase sempre não) percebida conscientemente e imediatamente, e estéreo (que, com estéreo articular, há sempre em grandes quantidades) - apenas subconscientemente e no processo de escuta por algum tempo.

Esta é a principal razão que não dá ao som de camada de 128 kbps para ser considerada a qualidade completa do CD. O fato é que, por si só, a transformação do som estéreo em mono dá fortes efeitos negativos - muitas vezes o mesmo som é repetido em diferentes canais com um pequeno atraso que quando misturado, dá apenas um som borrado no tempo. O som mono feito de som estéreo soa muito pior do que o registro mono original. O canal de diferença, além do Central (Misto Mono), dá uma separação reversa completa à direita e à esquerda, mas a ausência parcial de um canal de diferença (codificação insuficiente) traz não apenas uma imagem espacial insuficiente, mas também esses efeitos desagradáveis de misturar som estéreo em um canal mono.

Quando todos os outros obstáculos são eliminados - o equipamento é bom, a cor tonal e a dinâmica são inalteradas (o fluxo é suficiente para codificar o canal central) - ainda permanecerá. Mas há fonogramas registrados de tal forma que os efeitos negativos da compressão com base no aparelho de som médio / lateral não se manifestam - e, em seguida, 128 kbit / s dá a mesma qualidade total que 256 kbps. Caso privado - O fonograma pode ser rico no significado de informações estéreo, mas informações ruins - por exemplo, um jogo lento no piano. Neste caso, para codificar um canal de diferença, o fluxo é completamente suficiente para transmitir informações espaciais precisas. Há casos mais difíceis - um arranjo ativo, cheio de várias ferramentas, no entanto, soa 128 kbps muito bons - mas isso raramente é encontrado, pode em um caso de cinco a dez. No entanto, é encontrado.

Na verdade soa. É difícil destacar o som direto do som do canal central em Layer3 128 Kbps. A falta de transmissão de frequência é superior a 16 kHz (a propósito, é muito rara, mas ainda transmitida) e uma certa diminuição da amplitude é muito alta - estritamente falando em si - apenas um absurdo. Uma pessoa em poucos minutos se acostumiza e não a tais distorções tonais, simplesmente não pode ser considerada fortes fatores negativos. Sim, é distorção, mas para a percepção de "qualidade total" - muito traseira. Por parte da central, o som diretamente, o canal é possível por outro tipo - uma limitação aguda do fluxo disponível para codificar este canal, causado por circunstâncias simplesmente bytensivas - informações espaciais muito abundantes carregadas com uma variedade de sons, frequentes ineficientes blocos e como resultado de todo este - fluxo de buffer de reserva totalmente consumido. Isso acontece, mas relativamente raro, e isso - se tal fato ocorrer, geralmente é perceptível em grandes fragmentos continuamente.

Mostrar defeitos desse tipo de forma explícita para perceber que qualquer pessoa é muito difícil. Eles avisarão facilmente mesmo sem lidar com uma pessoa que é usada para lidar com o som, mas para um ouvinte não crítico comum pode parecer completamente indistinguível do som original e algum resumo cavando o que não é realmente .. e ainda olhar para o exemplo. Era necessário aplicar um forte processamento à sua alocação - reduzir significativamente o conteúdo de freqüências médias e altas após a decodificação. Eu removo interferindo para ouvir essas nuances de frequência. Nós, é claro, violar o trabalho do modelo de codificação, mas isso ajudará a entender melhor o que estamos perdendo. Então, como deve soar (256_bass.mp3, 172 KB), e o que acontece após decodificação e processamento de um fluxo de 128 kbps (128_bass.mp3, 172 KB). Preste atenção à perda notável da continuidade, a suavidade do som do baixo, bem como algumas outras anomalias. Transferir baixas frequências Neste caso, doado em favor de frequências mais altas e informações espaciais.

Deve-se notar que o trabalho do modelo de compressão acústica pode ser observado (com aprendizagem atenta e tendo alguma experiência com som) e 256 kbps, se você aplicar um equalizador mais ou menos forte. Se você fizer isso e, então, ouvir, será possível, às vezes, (muitas vezes) perceber efeitos desagradáveis \u200b\u200b(toque / bullhead). Mais importante, o som após tal procedimento terá um personagem desagradável e desigual, o que é muito difícil de notar imediatamente, mas será visivelmente com uma longa escuta. A diferença entre 128 e 256 é apenas que em um fluxo de 128 kbps, esses efeitos não existem sem qualquer processamento. Eles também são difíceis de perceber imediatamente, mas são - um exemplo com baixo dá alguma idéia de onde procurar por eles. Ouvir em altos fios (acima de 256 kbps) sem processamento é simplesmente impossível. Esse problema não se refere a fluxos altos, mas há algo que às vezes (muito raramente) não permite até mesmo camada3 - 256 kbit / com o original - estes são parâmetros temporários (mais detalhes estarão em um artigo separado posteriormente: ver MPEG Layer3 - 256 / link para outro artigo /).

Existem fonogramas que não dizem respeito a esse problema. A maneira mais fácil é listar os fatores que, pelo contrário, levam ao surgimento da distorção descrita acima. Se nenhum deles estiver concluído - há uma grande chance de sucesso, nesse aspecto, codificação em Layer3 - 128 Kbps. Tudo depende, no entanto, de um material específico ...

Primeiro de tudo, o barulho, digamos hardware. Se o fonograma é ruído tangível - é muito indesejável para codificar em pequenos fluxos, já que muito do fluxo vai para codificar informações desnecessárias, o que também não é razoável demais para ser codificando razoável com a ajuda de um modelo acústico.

  • Apenas barulho - todos os tipos sons altos. Ruído monótono da cidade, rua, restaurante, etc., contra o qual a ação principal ocorre. Esse tipo de sons dá um fluxo muito abundante de informações que devem ser codificadas, e o algoritmo será forçado a sacrificar algo no material principal.
  • Efeitos estéreo fortes não naturais. Além disso, pertence ao item anterior, mas em qualquer caso - muito do fluxo vai para o canal de diferença, e a codificação do canal central é fortemente se deteriorar.
  • Distorção de fase forte, diferente para diferentes canais. Em princípio, isso se relaciona, em vez das falhas dos algoritmos de codificação comuns neste momento do que para o padrão, mas ainda assim. As distorções mais loucas começam por causa da desagregação completa de todo o processo. Para essas distorções do fonograma inicial, na maioria dos casos, registros em equipamentos de cassete e digitalização subseqüente, especialmente quando reproduzem gravadores de fita baratos com reversos de baixa qualidade. As cabeças são tortas, a fita venta o oblíquo, e os canais são ligeiramente detidos um parente ao outro.
  • Apenas registro sobrecarregado. Muito grosseiramente falando - a grande orquestra sinfônica joga todo :). Normalmente, como resultado da compressão em 128 kbps, algo é completamente esboçado - câmara, cobre, tambores, solista. É encontrado, é claro, não só nos clássicos.

Outro polo é o que geralmente é comprimido:

  • Ferramenta solo com relativamente som simples - Guitarra, piano. Violino, por exemplo, tem um espectro e sons muito cheios geralmente não é muito bom. Do violino violinista, na verdade, depende do trabalho em si. Também é bem compactado por várias ferramentas - Bards ou SSP, por exemplo (ferramenta + voz).
  • Qualidade moderna fazendo música. Isso não significa qualidade musical, mas a qualidade do som é a redução, a localização das ferramentas, a ausência categórica de efeitos globais complexos que decoram sons e é geralmente supérfluo. Nesta categoria, por exemplo, todo o pop moderno, também alguma rocha e, em geral, há muitas coisas.
  • Música agressiva, "eletricidade". Bem, para de alguma forma trazer um exemplo - início do Metallica (e moderno em geral também). [Lembre-se, não sobre estilos musicais! apenas um exemplo.]

Vale a pena notar que a compressão de camada quase não impressiona os parâmetros, como a presença / ausência de altas frequências, baixo, surdo / toque, etc. Há uma dependência, mas tão fraca que você não pode levá-lo em conta.

Infelizmente (ou felizmente?), Ele se repete na própria pessoa. Muitas pessoas sem preparação e pré-seleção ouvem a diferença entre os fluxos de cerca de 128 kbps e o original, muitos exemplos extremos sintéticos não são percebidos pela audição como distinção. Primeiro você não precisa convencer nada, os segundos exemplos e não convencer ... Pode-se simplesmente dizer que alguém tem uma diferença, e alguém não tem, se não fosse por uma coisa: no processo de ouvir música Com o tempo, nossa percepção é de todo o tempo está melhorando. Parecer boa qualidade Ontem, amanhã não parece mais parecer um - sempre acontece. E se é bastante inútil (pelo menos na minha opinião) para comprimir em 320 kbps em comparação com 256 kbps - os ganhos não são muito importantes, embora seja claro, então para manter a música pelo menos 256 kbps ainda.

Neste artigo, vamos esclarecer os cavalos da codificação de Aduo, afetando a qualidade de seu som. Entender as configurações de conversão ajudará você a escolher a opção de codificação de som mais adequada do ponto de vista do relacionamento de tamanho de arquivo para a qualidade do som.

O que é uma taxa de bits?

A taxa de bits é a quantidade de dados por unidade de tempo usada para transmitir fluxo de áudio. Por exemplo, uma taxa de bits 128 Kbps é descriptografada como 128 kilobit por segundo e significa que 128 mil bits são usados \u200b\u200bpara codificar um segundo de som (1 byte \u003d 8 bits). Se você traduzir esse valor em kilobytes, então aparece que um segundo som leva cerca de 16 kb.

Assim, quanto maior o caminho da pista, mais espaço você leva em sua computação. Mas, ao mesmo tempo, dentro de um único formato, uma taxa de bits maior permite gravar som com maior qualidade. Por exemplo, se você converter áudio-CD para MP3, então com uma taxa de bits de 256 kbps, o som será significativamente melhor do que com uma taxa de bits de 64 kbps.

Como agora o espaço em disco se tornou bastante barato, recomendamos converter para MP3 com uma taxa de bits não inferior a 192 kbps.

Também distinguir bits de bits constantes e variáveis.

A diferença entre a taxa de bits constante (CBR) do AC (VBR)

Com uma taxa constante para codificar todas as seções do som, a mesma quantidade de bits são usadas. Mas a estrutura de som é geralmente diferente e, por exemplo, para codificação de silêncio, significativamente menos bits são necessárias do que codificar o som saturado. Uma taxa de bits variável, ao contrário da constante, ajusta automaticamente a qualidade da codificação, dependendo da complexidade do som em certos intervalos. Ou seja, uma taxa de bits inferior será usada para seções de simples codificação, e um valor mais alto será aplicado para complexo. O uso de uma taxa de bits variável permite que você obtenha uma maior qualidade de som com um tamanho de arquivo menor.

Qual é a frequência de amostragem?

Este conceito ocorre ao converter sinal analógico Em digital e indica o número de amostras (medições de nível de medição) por segundo, que são realizadas para converter o sinal.

Qual é o número de canais?

Canal, administrativamente para a codificação de áudio é um fluxo de som independente. Mono - um córrego, estéreo - dois córregos. N.m é frequentemente usado para se referir ao número de canais, em que n é o número de canais de som de pleno direito, e m é o número de canais de baixa frequência (por exemplo 5.1).

Você já se perguntou o que exatamente é perdido quando comprimido de sem perdas em MP3 128 Kbps ou 320 kbps?
Eu verifiquei e o resultado parecia interessante. Primeiro de tudo, proponho uma pesquisa para entender por si mesmo para saber se a diferença é em geral. Se você não tem certeza de que ouve ou tem certeza de que você não ouve, proponho uma ideia simples e elegante para visitar sua atenção: um dos quais estará em antiphase, respectivamente, na informação das duas faixas, será preferencialmente ouviu que não resgatou. Gráficos interessantes ainda não prometem, mas você pode se ouvir em nosso sistema que tipo de sons são perdidos quando comprimidos do flac em mp3 128 \\ 320 kbps, um arquivo com exemplos no final do artigo.
Entrevista
Você precisa baixar e ouvir 12 faixas por 30 segundos. Em seguida, para especificar para cada uma das 4 composições uma das 3 opções (128 Kbps, 320 kbps ou sem perdas).
A pesquisa é anônima, mas você pode especificar um hash único e dizer para mim, como último recurso, publique sua opinião aqui, mas necessariamente sob o spoiler. A pesquisa durará até 25.02, após a chave e estatística.
Arquivos no disco yandex, espelho no Dropbox (~ 80MB).
Dados iniciais
As teclas pretas - luz eterna (FLAC, 44100 Hz, 24 bits, 1613 Kbps), você pode ler YouTube..
Ludovico Einaudi - Drop (Flac, 96000 Hz, 24 bits, 2354 Kbps), você pode ler Yandex Music.
CC Coletti - Rock and Roll (FLAC, 192000 Hz, 24 bits, 4845 Kbps), você pode ler em YouTube..
Annihilator - ultra-movimento (FLAC, 44100 Hz, 16 bits, 1022 Kbps), você pode ler em YouTube..
Parâmetros de conversão em MP3
44.1khz, estéreo, 128 kbps ou 320 kbps
Descrição do experimento
Os arquivos de origem são cortados em pedaços de 10 segundos, cada uma das peças é exportada para WAV. Depois de importar as faixas obtidas para o início de cada um, 2 segundos de silêncio e um segundo sinal de tom são adicionados e, em seguida, convertidos em MP3. Depois de importar arquivos MP3, ela é relativa ao original, o arquivo resultante "foi em frente". Isso não é um bug, é. Realizamos a sincronização com relação ao sinal de tom especificado do original (eu tentei para cada arquivo MP3 vários valores, que subseqüentemente esclarecidos com o melhor resultado), livrar-se do sinal de tom, o silêncio e os negócios obtidos são exportados para WAV. Agora resta inverter as faixas para obter picos multidirecionais e reduzir o original.
Resultado
Eu não vou abrir a América ... Sim, há uma diferença. Sim, especialmente quando comprimido para 128kbps. Sim, depende da música. Sim, ainda mais do código de áudio.
Faça uma saída independente e ouça a diferença que você pode baixar os arquivos