Back to Search Start Over

Transcrição, alinhamento e criação de legendas em uma base de História Oral

Authors :
Alvarenga, Lucas Meireles Tomaz de
Escolas::EMAp
Silva, Moacyr Alvim Horta Barbosa da
Source :
Repositório Institucional do FGV (FGV Repositório Digital), Fundação Getulio Vargas (FGV), instacron:FGV
Publication Year :
2019

Abstract

Dado a evolução da tecnologia relacionada a reconhecimento automáticode fala nos é permitido criar ferramentas que automatizem processos que somenteeram possíveis serem feitos por humanos, se o objetivo fosse ter uma boa qualidadeno resultado. Sendo assim, o objetivo desse trabalho é pesquisar a literatura emreconhecimento automático de fala e utilizar esse conhecimento para criar ferra-mentas que auxiliem o Centro de Pesquisa e Documentação de História Contem-porânea do Brasil (CPDOC) com o programa de História Oral. Além disso, espe-ramos que esse trabalho possa auxiliar outros centros que trabalhem com históriaoral, como por exemplo: Associação Internacional de História Oral (IOHA), RedeLatino-Americana de História Oral (RELAHO) e Associação brasileira de HistóriaOral (ABHO). Após um estudo sobre as principais técnicas na área de reconheci-mento automático de áudio, foi decidido utilizar um software proprietário para atranscrição automática da fala das entrevistas que populam o banco de dados deHistória Oral. Com a transcrição automática, utilizamos uma variação do algoritmode Needleman-Wunsch para alinharmos essa transcrição com a transcrição manualdas entrevistas, essas transcrições foram feitas por pessoas e não possuem o tempodas frases. Esse alinhamento possibilita a criação de legendas com um texto maiscorreto do que seria possível somente com a transcrição automática. Concluímos quetranscrições automáticas podem ser utilizadas no contexto de História Oral, que épossível alinhar textos utilizando o algoritmo de Needleman-Wunsch e dado essealinhamento é possível criar uma legenda, que a perda de sincronia entre o áudio eo texto não impossibilita o uso da mesma. Given the evolution of technology related to automatic speech recognitionwe are able to create tools that automate processes that could only be done byhumans, if we wanted to have a good quality in the result. Therefore, the objectiveof this work is to research the literature about automatic speech recognition and usethis knowledge to create tools that support the Center for Research and Documenta-tion of Contemporary History of Brazil (CPDOC) with the Oral History project. Inaddition, we hope that this work can help other centers that work with oral history,such as: International Oral History Association (IOHA), Latin American Oral His-tory Network (RELAHO) and Brazilian Association of Oral History (ABHO). Afterthe study on the main techniques in the area of Automatic Speech Recognition, Itwas decided to use proprietary software to automatic transcribe the interviews thatpopulate the Oral History database. With the automatic transcription, we used avariation of the Needleman-Wunsch algorithm to align this transcription with amanual transcription, these transcriptions were made by human and do not havethe time of the sentences. This enable the creation of subtitles with a more correcttext than would be possible with automatic transcription alone. We conclude thatautomatic transcriptions can be used in the context of Oral History, that it is possi-ble to align texts using the Needleman-Wunsch algorithm and given this alignmentIt is possible to create a subtitle, that the loss of synchrony between the audio andthe text does not preclude the use of It.

Details

Language :
Portuguese
Database :
OpenAIRE
Journal :
Repositório Institucional do FGV (FGV Repositório Digital), Fundação Getulio Vargas (FGV), instacron:FGV
Accession number :
edsair.od......3056..0f4ad10d0cf52701d7cdd63dc808081a