A construção do corpus de artigos científicos de aviação:

um estudo interdisciplinar

Autores

  • Fernanda Beatriz Caricari de Morais Divisão de Ensino, Academia da Força Aérea, AFA, Pirassununga, SP, Brasil
  • João Paulo Martins dos Santos Divisão de Ensino, Academia da Força Aérea, AFA, Pirassununga, SP, Brasil.

DOI:

https://doi.org/10.22480/revunifa.2024.37.617

Palavras-chave:

Corpus, Linguística de Corpus, Linguística Sistêmico-Funcional

Resumo

Este artigo relata a experiência da construção de um corpus de artigos científicos da área de aviação escritos em Língua Inglesa e o tratamento linguístico-computacional dado pela Linguística de Corpus. A coleta foi realizada por meio de técnicas de programação computacional de raspagem de dados, o que permitiu coletar artigos de duas revistas eletrônicas: Air & Space Power Journal e Journal of Aviation/Aerospace Education and Research.  O corpus é utilizado para pesquisas linguísticas, tendo como base a Linguística Sistêmico-Funcional (HALLIDAY, 1994 e HALLIDAY & MATTHIESSEN, 2004, 2014), que vê a língua é um sistema potencial de significados, em que o conceito de escolha é importante por permitir o estudo de regularidades lexicais, tendo implicações tanto para a descrição linguística, como para o ensino. Com o uso de ferramentas computacionais da Linguística de Corpus (BERBER-SARDINHA, 2000, 2004), é possível trabalhar com uma grande quantidade de textos, obtendo elementos que auxiliam na análise qualitativa dessas regularidades. Como resultado, tem-se um corpus de estudo que pode ser considerado de médio a grande porte, com mais de três milhões de palavras. Espera-se que a construção desse corpus fomente novas pesquisas linguísticas e estatísticas na área de aviação, especialmente envolvendo cadetes de iniciação científica e de trabalho de conclusão de curso.

Biografia do Autor

Fernanda Beatriz Caricari de Morais, Divisão de Ensino, Academia da Força Aérea, AFA, Pirassununga, SP, Brasil

É Professora Adjunta III da Academia da Força Aérea. Doutora em Linguística Aplicada e Estudos da Linguagem (PUC-SP), com período no Departamento de Estudos Anglísticos da Universidade de Lisboa. Pós-doutorado na UFU (PNPD/CAPES) e na PUC-SP (PDJ/CNPq). Professora do Mestrado Profissional em Educação Bilíngue do INES/MEC-RJ desde 2014. Membro do grupo de pesquisa internacional SAL (Systemics Across Languages), dialogando também com o Núcleo de Estudos Interdisciplinares em Ciências Aeroespaciais (NEICA/UNIFA). Seus interesses de pesquisa estão relacionados com o uso da Linguística Sistêmico-Funcional e da Linguística de Corpus para análise de diversos aspectos de uso da linguagem. Atualmente, analisa as características léxico-gramaticais de artigos acadêmicos da área da aviação publicados em periódicos americanos.

João Paulo Martins dos Santos , Divisão de Ensino, Academia da Força Aérea, AFA, Pirassununga, SP, Brasil.

Possui graduação em Licenciatura em Matemática pela Universidade Estadual Paulista Júlio de Mesquita Filho (2006), mestre em Matemática pela Universidade Estadual Paulista Júlio de Mesquita Filho (2009) e Doutor em Ciências pela Escola de Engenharia de São Carlos - EESC-USP. É professor Adjunto na Academia da Força Aérea em Pirassununga/ SP. Possui experiência na área de Sistemas Dinâmicos não lineares e não ideais, métodos de perturbação, métodos numéricos para solução de sistemas lineares, método de elementos finitos. Tem experiência nas áreas de Ensino e Matemática com interesse em método numéricos para solução de equações diferenciais ordinárias e parciais, estimador
de erro do tipo residual para a equação do transporte de poluentes, linguagem Python de programação, Computação Científica em Python e métodos numéricos para solução de sistemas lineares, ensino de Matemática.

Referências

BERBER SARDINHA, T. Computador, corpus e concordância no ensino de léxico-gramática de língua estrangeira. In: V, Leffa (org.) As palavras e sua companhia: o léxico na aprendizagem. Pelotas: EDUCAT, UCP, p. 45-72, 2000.

BERBER SARDINHA, T. Linguística de Corpus. Barueri-SP: Manole, 2008.

BIBER, D. Representativiness in Corpus Design. Linguist Computing. v. 8, p. 243-257, 1993.

BIRD, Steven; LOPER, Edward; KLEIN, Ewan. Natural Language Processing with Python. O’Reilly Media Inc., 2009. Disponível em: https://www.nltk.org/book/. Acesso em: 24 jul. 2023.

BISONG, E. Google Collaboratory. In: Building Machine Learning and Deep Learning Models on Google Cloud Platform. Berkeley, CA: Apress, 2019. Capítulo 7. Disponível em: https://doi.org/10.1007/978-1-4842-4470-8_7.

CRYSTAL, D. English as a global Language. Cambridge. Cambridge University Press, 1997.

EGGINS, S. An introduction to Systemic Functional Linguistics. Londres: Pinter Publishers, 1994.

GOUVEIA, C. Texto e gramática: uma introdução a linguística sistêmico-funcional.

Matraga. Rio de Janeiro, v. 16, n. 24, p. 13-47, 2009.

GROSS, A. The rhetoric of science. Cambridge, MA: Harvard University Press, 1996.

HALLIDAY, M. A. K. An introduction to Functional Grammar. Londres: Edward Arnold, 1994.

_________________. & MATTHIESSEN, C. M.I.M. An introduction to Functional Grammar. Londres: Edward Arnold. Third Edition, 2004.

_______ & MATTHIESSEN, C. M.I.M. An introduction to Functional Grammar. Londres: Edward Arnold. Third Edition, 2014.

HARRIS, Charles R. et al. Array programming with NumPy. Nature, v. 585, n. 7825, p. 357-362, set. 2020. DOI: 10.1038/s41586-020-2649-2. Disponível em: https://doi.org/10.1038/s41586-020-2649-2.

HUNTER, J. D. Matplotlib: A 2D Graphics Environment. Computing in Science & Engineering, v. 9, n. 3, p. 90-95, 2007.

pdfminer.six. (2023). pdfminer.six (Version 20221105). [Software de extração de texto de PDF]. Disponível em: https://pypi.org/project/pdfminer.six/. GitHub repository: https://github.com/pdfminer/pdfminer.six.

Leonard Richardson. BeautifulSoup (Version 4.11.2). [Pacote Python para análise de documentos HTML e XML]. Disponível em: https://pypi.org/project/beautifulsoup4/. GitHub repository: https://github.com/wention/BeautifulSoup4.

MARTIN, J. R. English Text: System and Structure. Ámsterdam: Benjamins, 1992.

McENERY, T. & WILSON, A. Corpus Linguistics. Edinburgh, Edinburgh University Press.

MOITA LOPES, L. P. (Org.) Por uma. Linguística Aplicada Indisciplinar. São Paulo: Parábola Editorial, 2006.

AUTOR1. Entre alhos e bugalhos – os usos do clítico SE na escrita acadêmica. Tese de Doutorado. PUC-SP. 2013.

___________. Os dizentes nos artigos científicos de Linguística - um estudo baseado na Linguística Sistêmico-Funcional e com o auxílio da Linguística de Corpus. Letras & Letras, v. 30, p. 46-63, 2014.

___________. O uso do processo existencial ‘haver’ na escrita acadêmica: um estudo com base em um corpus de artigos científicos de diversas áreas do conhecimento. Revista (Con) Textos Linguísticos (UFES), v. 9, p. 142-160, 2015.

___________. O gênero resenha na sala de aula de Língua Portuguesa como L2. Anais do IV Encontro Mundial de Ensino de Língua Portuguesa. Washington: Georgetown University, 2016.

MOREIRA FILHO, J. L. Python para Linguística de Corpus : guia prático, 1. ed., São Paulo, Ed. do Autor, 2021.

SANCHEZ, A. Definicion e historia de los corpus. In: SANCHEZ, A et al (Org.) CUMBRE – corpus linguistico de espanol contemporaneo. Madrid: SGEL, 1995.

SCOTT, M. R. Wordsmith Tools v. 8. Software for text analysis. Oxford University Press, 2018.

THOMPSON, G. Introducing Functional Grammar. New York: Routledge, 1996.

TRASK, R. L. Dicionário de Linguagem e Linguística. São Paulo: Contexto, 2004.

VIRTANEN, Pauli et al. SciPy 1.0: Algoritmos fundamentais para computação científica em Python. Nature Methods, v. 17, p. 261-272, 2020. DOI: 10.1038/s41592-019-0686-2.

WIDDOWSON, H. ELF and the pragmatics of language variation. Journal of English as Lingua Franca. V. 4 (2), pp. 359-372, 2015.

Downloads

Publicado

2024-03-18

Como Citar

MORAIS, F. B. C. de; SANTOS , J. P. M. dos. A construção do corpus de artigos científicos de aviação: : um estudo interdisciplinar. Revista da UNIFA, Rio de Janeiro, v. 37, p. 1–21, 2024. DOI: 10.22480/revunifa.2024.37.617. Disponível em: https://revistaeletronica.fab.mil.br/index.php/reunifa/article/view/617. Acesso em: 28 abr. 2024.

Edição

Seção

Artigos Originais