Z A C Z Y N A M Y

Ładowanie...

5 zasad: AI w badaniach jakościowych do pracy dyplomowej - RODO i etyka - Pomoce dla piszących pracę magisterską i licencjacką

Schemat ewolucji etyki badań: Research Ethics 1.0 - świadoma zgoda uczestnika, Research Ethics 2.0 - odpowiednie metody badawcze, Research Ethics 3.0 - ingerencja AI i algorytmów

5 zasad: AI w badaniach jakościowych do pracy dyplomowej – RODO i etyka

Zastosowanie AI w badaniach jakościowych do pracy dyplomowej staje się coraz powszechniejsze – od transkrypcji wywiadów po anonimizację danych. W tym przewodniku pokażę Ci, co możesz robić legalnie i etycznie, a co może unieważnić Twoją pracę. To co jeszcze niedawno wymagało ręcznego notowania, teraz można bardzo sobie ułatwić wykorzystując możliwości sztucznej inteligencji. Jednakże konieczne jest spełnienie konkretnych warunków: świadomej zgody uczestnika na wykorzystanie narzędzia przez badacza, zgodności tego narzędzia z RODO oraz jasnego planu co się dzieje z danymi po zakończeniu badania. Brak któregokolwiek z tych elementów w formularzu zgody to nie “formalność”, to realne ryzyko zakwestionowania rozdziału metodologicznego przez promotora lub recenzenta.

AI w badaniach jakościowych do pracy dyplomowej – schemat etyki

Etyka badań naukowych nie powstała w jednym roku. Rozwijała się falami – i każda fala przynosiła nowe wymagania wobec badaczy.

Pierwsza faza, którą badaczka Loreta Tauginienė (Kaunas University of Technology) nazywa Research Ethics 1.0, skupiała się na świadomej zgodzie uczestników. Badany musiał wiedzieć, że bierze udział w badaniu i co się z jego danymi stanie. Drugi etap – Research Ethics 2.0 – przesunął ciężar na metody: nie tylko “czy uczestnik wie”, ale też “czy metody są odpowiednie i właściwie stosowane” (Brall et al., 2017; Masso et al., 2025). Teraz jesteśmy w fazie Research Ethics 3.0. Definiuje ją ingerencja nieludzka – algorytmy, modele językowe, narzędzia AI (Ess, 2017). I ta faza trafia bezpośrednio w studentów piszących prace dyplomowe z badaniami jakościowymi.

Schemat ewolucji etyki badań: Research Ethics 1.0 - świadoma zgoda uczestnika, Research Ethics 2.0 - odpowiednie metody badawcze, Research Ethics 3.0 - ingerencja AI i algorytmów

Jeśli w Twojej pracy są wywiady, grupy fokusowe, nagrania lub transkrypcje – nie możesz ich przetwarzać AI-em bez spełnienia konkretnych warunków. Nie dlatego, że promotor jest konserwatywny. Dlatego, że tak mówi RODO – a Polska, jako kraj UE, stosuje je wprost. Co więcej, Byłeń przypomina, że student jako autor “ponosi pełną odpowiedzialność z tytułu oryginalności i rzetelności przedstawionego materiału” (Byłeń, s. 194). Odpowiedzialność za dane uczestników Twoich badań leży po Twojej stronie – nie po stronie narzędzia AI, które ich użyłeś.

Czy możesz użyć AI do transkrypcji wywiadu? Tak – ale spełnij 3 warunki

Krótka odpowiedź: tak, możesz. Pod warunkiem, że zadbałeś o trzy rzeczy zanim nagrałeś pierwsze słowo.

Transkrypcja AI ma sens – i to duży. Badanie z 2024 roku pokazuje, że AI redukuje czas pracy z transkrypcją o połowę. Ręczna transkrypcja 30-minutowego wywiadu zajmuje około 1,5 godziny. Wersja AI jako pierwszy szkic – poniżej minuty (Tauginienė, 2026). To czas, który możesz przeznaczyć na analizę danych zamiast przepisywania.

Tylko że głos jest danymi osobowymi w rozumieniu RODO. Zanim więc wgrasz nagranie do Whisper, Otter.ai, Fireflies czy jakiegokolwiek innego narzędzia – musisz mieć spełnione trzy warunki:

Warunek 1: Zgoda uczestnika na konkretne narzędzie – nie na “AI” w ogóle.

Ogólne zdanie “dane będą przetwarzane z pomocą narzędzi cyfrowych” nie wystarczy. Formularz świadomej zgody powinien wymieniać konkretne narzędzie – np. “transkrypcja będzie wykonana z użyciem Whisper (OpenAI)” lub “nagranie zostanie wgrane do Otter.ai w celu stworzenia pierwszej wersji transkryptu”. Uczestnik musi mieć możliwość odmowy na to konkretne narzędzie – i wtedy transkrypcja powinna odbyć się ręcznie lub przez inny zaakceptowany sposób (European Commission, 2025; Hitch, 2024).

Tip – które narzędzie wybrać? Najbezpieczniejszą opcją pod kątem RODO jest lokalna wersja Whisper (OpenAI) działająca offline – dane nie opuszczają Twojego urządzenia i nie trafiają na żadne serwery. Przed użyciem jakiejkolwiek platformy chmurowej (Otter.ai, Fireflies, Notta i inne) sprawdź w polityce prywatności czy dane są używane do trenowania modelu i gdzie są przechowywane. Serwery w UE to dodatkowy plus pod kątem RODO.

Warunek 2: Narzędzie nie może trenować się na Twoich danych.

To jeden z najczęściej pomijanych punktów. Część narzędzi AI w wersji bezpłatnej domyślnie używa przesłanych treści do trenowania modelu. Oznacza to, że głos Twojego respondenta – potencjalnie zawierający wrażliwe dane – trafia do zbioru treningowego firmy technologicznej. To naruszenie RODO. Przed wyborem narzędzia sprawdź jego politykę prywatności pod kątem tego punktu. Whisper działający lokalnie (offline) jest bezpieczniejszy niż większość platform chmurowych w wersji free (European Commission, 2025).

Warunek 3: Uczestnik musi wiedzieć, kiedy nagranie zostanie skasowane i gdzie trafi transkrypt.

Formularz zgody powinien zawierać: (1) datę lub etap, po którym nagranie zostaje usunięte – np. “nagranie zostanie usunięte po zatwierdzeniu transkryptu przez badacza”, (2) gdzie transkrypt będzie przechowywany i kto będzie miał do niego dostęp (Tauginienė, 2026).

Tip: Jeśli piszesz pracę na kierunku z nauk społecznych lub humanistycznych i masz wywiady – stwórz osobny dokument “Procedura przetwarzania danych badawczych” jako załącznik do metodologii. To sygnał dla recenzenta, że wiesz co robisz.

Warto też wiedzieć, że dokładność transkrypcji AI nie jest jednakowa dla wszystkich. Badania pokazują niższą dokładność dla nagrań młodszych respondentów, osób mówiących z akcentem oraz nienatywnych użytkowników danego języka – modele językowe mają też udokumentowane uprzedzenia wobec dialektów i mniejszości językowych, co może wpłynąć na jakość transkryptu przy badaniach z grupami mniejszościowymi lub migrantami (Tauginienė, 2026). Zawsze weryfikuj transkrypt przed użyciem go w analizie – szczególnie imiona, nazwy własne i liczby.

Jest jeszcze jeden rzadko wspominany powód, dla którego warto rozważyć transkrypcję AI przy wrażliwych tematach: ochrona psychologiczna badacza. Jeśli prowadzisz wywiady dotyczące przemocy, molestowania, żałoby lub trudnych doświadczeń – wielokrotne odsłuchiwanie nagrań przy ręcznym przepisywaniu może być psychicznie obciążające. Narzędzie AI jako pierwszy szkic pozwala skrócić czas ekspozycji na trudne treści (Tauginienė, 2026). Studenci piszący prace na takie tematy rzadko myślą o tym z wyprzedzeniem – a potem przyznają, że przepisywanie nagrań było najtrudniejszą częścią całego procesu badawczego.

Anonimizacja vs pseudonimizacja – co naprawdę mówi RODO

To rozróżnienie jest pomijane w niemal każdym polskim podręczniku pisania prac dyplomowych. A jest fundamentalne – szczególnie jeśli Twoja praca trafi do repozytorium uczelni lub planujesz publikację wyników.

RODO wskazuje dwa tryby ochrony danych osobowych uczestników badań:

Anonimizacja Pseudonimizacja
Co to jest Dane przetworzone tak, że osoba nie jest i nie może być zidentyfikowana Dane zastąpione kodami – ale można je odwrócić przy użyciu klucza
Czy można zidentyfikować osobę Nie – nawet przy użyciu dodatkowych danych Tak – jeśli ktoś ma klucz lub wystarczająco dużo kontekstu
Przykład “Respondent A, branża IT, miasto powyżej 500 tys. mieszkańców” bez żadnych dodatkowych danych “P1” – ale w oddzielnym pliku masz: P1 = Jan Kowalski, Warszawa, firma XYZ
Kiedy stosować Gdy dane mają być w pełni otwarte / opublikowane Gdy dane są potrzebne do dalszej weryfikacji
Kto decyduje Uczestnik badań – w formularzu zgody Uczestnik badań – w formularzu zgody
Porównanie anonimizacji i pseudonimizacji danych osobowych według RODO: anonimizacja - osoba nieidentyfikowalna, nieodwracalne, wymagana przy otwartych zbiorach; pseudonimizacja - możliwa re-identyfikacja kluczem, prostsze wykonanie, dane zastąpione kodem
Anonimizacja vs pseudonimizacja – dwa tryby ochrony danych w rozumieniu RODO (2016). Źródło: opracowanie własne na podstawie Tauginienė (2026).

I tu pojawia się problem, który dobrze ilustrują dane z badań. GPT rozpoznał tożsamość 72,6% opisów osób publicznych za pierwszym razem i 79,72% za drugim – co oznacza, że był trzy razy skuteczniejszy niż ludzie (Patsakis & Lykousas, 2023). Drugie badanie, przeglądające 69 artykułów z zakresu de-identyfikacji klinicznych tekstów anglojęzycznych, pokazuje, że skuteczność de-anonimizacji przy użyciu AI wynosi ponad 98% (Kovačević et al., 2024).

Co to oznacza dla Ciebie? Opis “P1, kobieta, 34 lata, menedżer średniego szczebla w branży finansowej, Warszawa” – przy wystarczającej ilości danych – może być identyfikowalny przez model językowy. Szczególnie jeśli Twój respondent jest postacią publiczną, aktywną w mediach społecznościowych lub łatwo wyszukiwalną.

Dlatego anonimizacja w sensie prawnym – nie tylko “zmiana imienia na kod” – wymaga kombinacji technik: usunięcia lub uogólnienia miejsca pracy, stanowiska, lokalizacji, daty zdarzeń, relacji z innymi osobami wymienionymi w wywiadzie.

Ważne: RODO wymaga, żeby to uczestnik badania zdecydował, który tryb ochrony jego danych wybiera. Ten wybór musi być zawarty w formularzu świadomej zgody – nie może być narzucony przez badacza (Tauginienė, 2026).

Co musi znaleźć się w formularzu zgody uczestnika badań

Świadoma zgoda uczestnika badań to nie formalność do “odhaczenia”. To dokument prawny – i jednocześnie metodologiczny fundament Twojego rozdziału o etyce badań.

Jeśli w Twoich badaniach pojawia się AI, formularz zgody musi zawierać cztery elementy (Tauginienė, 2026):

(1) Jak będą chronione dane osobowe uczestnika Konkretnie: czy hasłem, w zaszyfrowanym pliku, w chmurze z dostępem ograniczonym, czy lokalnie na urządzeniu badacza.

(2) Jakie tryby ochrony są proponowane Uczestnik powinien mieć wybór między anonimizacją a pseudonimizacją – i powinien rozumieć różnicę. To oznacza, że formularz musi zawierać krótkie wyjaśnienie obu opcji w zrozumiałym języku.

(3) Jakie środki będą zastosowane do ochrony – w tym czy i jakie narzędzia AI Nie “narzędzia cyfrowe”. Konkretna nazwa narzędzia, jego producent, cel użycia (np. “transkrypcja nagrania”), informacja czy narzędzie jest RODO-compliant.

(4) Jakie ryzyko wiąże się z brakiem ochrony danych Jeśli uczestnik decyduje się na udostępnienie surowych danych bez anonimizacji – musi wiedzieć, co z tego wynika. Np. że wypowiedź z jego imieniem i nazwiskiem może trafić do repozytorium lub być cytowana w publikacji.

Obowiązek właściwego poinformowania uczestnika to nie akademicki wymysł – to wymóg RODO, który obowiązuje każdego badacza w Polsce, niezależnie od tego czy pisze pracę licencjacką, magisterską czy prowadzi projekt naukowy.

Tip – gotowe zdanie do formularza zgody: “Nagranie audio z wywiadu zostanie przepisane z użyciem narzędzia [nazwa, np. Whisper / Otter.ai], które nie wykorzystuje przesłanych danych do trenowania modelu AI. Nagranie zostanie usunięte w ciągu [X dni] od zatwierdzenia transkryptu. Transkrypt będzie przechowywany w [lokalizacja, np. zaszyfrowanym folderze na dysku lokalnym] i dostępny wyłącznie dla badacza.”

Realia polskich uczelni, czyli AI w badanich jakościowych do pracy dyplomowej

To zdanie może Cię zaskoczyć, ale jest prawdziwe: w praktyce polskich prac dyplomowych wymagania dotyczące anonimizacji danych są traktowane bardzo różnie.

RODO obowiązuje każdego – to fakt. Ale uczelnie w Polsce nie mają jednolitego standardu etyki badań na poziomie pracy licencjackiej i magisterskiej. Nie ma ogólnopolskiej komisji etyki, która sprawdza prace studenckie tak jak dzieje się to przy projektach badawczych w instytutach naukowych czy przy grantach. W praktyce oznacza to, że jeden promotor wymaga osobnego formularza świadomej zgody z wymienionymi narzędziami AI, a inny wystarczy mu zdanie w metodologii “dane zostały zanonimizowane”. Jeden recenzent zapyta o zgodność z RODO, drugi w ogóle o to nie zapyta.

To nie jest powód, żeby ignorować zasady opisane w tym artykule. To jest powód, żeby pierwszym krokiem po przeczytaniu tego tekstu było zapytanie własnego promotora – co konkretnie wymaga od Ciebie w kwestii ochrony danych uczestników. Jego wymagania są Twoim punktem wyjścia. Zasady RODO i dobre praktyki badawcze to Twój sufit – czyli standard, do którego warto dążyć niezależnie od tego, ile promotor formalnie wymaga.

Tip: Zapytaj promotora wprost: “Czy muszę przygotować formularz świadomej zgody dla uczestników wywiadów odnośnie narzędzi AI, z których korzystam? Czy wymagasz informacji o tym, jakich narzędzi używałem do transkrypcji?” Jedno pytanie na pierwszym spotkaniu oszczędzi Ci dużo niepewności na etapie pisania metodologii.

 


Pułapki, w które wpada większość studentów

Pułapka 1: “Wgrałem nagranie do ChatGPT żeby zrobił notatki”

ChatGPT w wersji bezpłatnej (i wcześniejszych wersjach płatnych) domyślnie mógł używać treści do trenowania. Nawet jeśli dziś ustawienia są inne – przesłanie głosu respondenta do narzędzia bez jego zgody na to konkretne narzędzie jest naruszeniem RODO. Nie “potencjalnym naruszeniem”. Naruszeniem.

Pułapka 2: Jedno ogólne zdanie zamiast świadomej zgody

“Wyrażam zgodę na przetwarzanie moich danych osobowych w celach naukowych” – to za mało. RODO wymaga w Europie nie tylko poinformowania, ale dania uczestnikowi realnej możliwości podjęcia autonomicznej decyzji co do sposobu przetwarzania danych (Tauginienė, 2026). Jedno ogólne zdanie to passive informing – etyka 1.0 z lat 70. Twoja praca powstaje w epoce 3.0.

Pułapka 3: Brak informacji kiedy dane zostaną skasowane

Nagrania i transkrypcje to dane osobowe. Muszą być przechowywane nie dłużej niż jest to niezbędne. Jeśli nie zapiszesz w formularzu zgody konkretnego momentu usunięcia nagrania – naruszasz zasadę minimalizacji danych z RODO.

Pułapka 4: “Zmieniłem imiona, więc jestem bezpieczny”

Dane o de-anonimizacji dotyczą przede wszystkim osób publicznych – polityków, prezesów, postaci medialnych, o których internet jest pełen informacji. W przypadku “zwykłego” respondenta ryzyko jest niższe, ale nie zerowe. Jeśli Twój rozmówca jest np. kierownikiem w konkretnej firmie w małym mieście, podał wiek, płeć i branżę – kombinacja tych danych może go identyfikować w środowisku zawodowym. Zmiana imienia i nazwiska to absolutne minimum. Musisz uogólnić lub usunąć każdą kombinację cech, która razem staje się identyfikująca – stanowisko, lokalizację, branżę, wiek, relacje z innymi osobami wymienionymi w wywiadzie.

Pułapka 5: Pominięcie w metodologii informacji o AI

Jeśli użyłeś AI w transkrypcji lub anonimizacji – napisz o tym wprost w rozdziale metodologicznym. Ukrycie tego jest nie tylko nieetyczne, ale też podważa zasadę poufności i transparentności wobec uczestników badań. W erze Research Ethics 3.0 jest to traktowane równie poważnie jak plagiat (Tauginienė, 2026).

 

Pięć pułapek przy użyciu AI do transkrypcji w badaniach: brak zgody uczestnika na narzędzie, trenowanie modelu na danych uczestnika, brak daty usunięcia nagrania, nieznane miejsce docelowe transkryptu, brak wybranego trybu ochrony danych
Pięć sygnałów ostrzegawczych przed wgraniem nagrania do AI. Jeśli którykolwiek dotyczy Twojej sytuacji – zatrzymaj się. Źródło: opracowanie własne na podstawie Tauginienė (2026); European Commission (2025)

 

 

Praktyczna checklista – etyczne AI w badaniach do pracy dyplomowej

Użyj jej zanim zaczniesz zbierać dane.

Przed badaniem:

  • Formularz zgody zawiera nazwę konkretnego narzędzia AI (nie “AI ogólnie”)
  • Narzędzie nie trenuje się na przesłanych danych – zweryfikowane w polityce prywatności
  • Formularz zawiera datę/etap usunięcia nagrania
  • Formularz zawiera lokalizację przechowywania transkryptu i kto ma do niego dostęp
  • Uczestnik ma wybór między anonimizacją a pseudonimizacją – z wyjaśnieniem różnicy
  • Uczestnik zna ryzyko braku ochrony danych (jeśli taką opcję mu oferujesz)

W trakcie badania:

  • Nagrywasz tylko za wiedzą i zgodą uczestnika
  • Plik nagrania jest zaszyfrowany lub przechowywany lokalnie (nie na publicznej chmurze bez zgody)

Po badaniu:

  • Weryfikujesz transkrypt AI pod kątem błędów (szczególnie imion, nazw, dat)
  • Anonimizujesz lub pseudonimizujesz zgodnie z wyborem uczestnika
  • Usuwasz nagranie w terminie zapisanym w formularzu zgody
  • W metodologii opisujesz użyte narzędzia AI i sposób weryfikacji transkryptu

FAQ

Czy można używać ChatGPT do analizy wywiadów w pracy dyplomowej? Można – pod warunkiem, że uczestnik wyraził świadomą zgodę na użycie tego konkretnego narzędzia do przetwarzania jego danych, a narzędzie nie używa treści do trenowania modelu. Musi to być opisane w rozdziale metodologicznym pracy.

Co to jest anonimizacja danych w pracy dyplomowej? Anonimizacja w rozumieniu RODO to przetworzenie danych w sposób, który uniemożliwia identyfikację osoby – nawet przy użyciu dodatkowych informacji. Samo zmienienie imienia na kod (P1, P2) to pseudonimizacja, nie anonimizacja. Różnica ma znaczenie prawne.

Czy RODO dotyczy pracy licencjackiej lub magisterskiej? Tak – jeśli w pracy przetwarzasz dane osobowe uczestników badań (nagrania, transkrypcje, ankiety z danymi identyfikującymi), RODO obowiązuje Cię tak samo jak każdego innego badacza. Bycie studentem nie zwalnia z obowiązku uzyskania świadomej zgody.

Jakie narzędzia AI do transkrypcji są bezpieczne pod kątem RODO? Najbezpieczniejsza jest lokalna wersja Whisper (OpenAI) działająca offline – dane nie opuszczają Twojego urządzenia. Przed użyciem jakiejkolwiek platformy chmurowej sprawdź jej politykę prywatności pod kątem: (1) czy dane są używane do trenowania, (2) gdzie są przechowywane (serwery w UE to dodatkowy plus).

Co napisać w rozdziale metodologicznym jeśli używałem AI? Podaj nazwę narzędzia, cel użycia (np. “pierwsza wersja transkryptu”), informację o weryfikacji wyników przez badacza oraz opis jak pozyskałeś zgodę uczestników na to narzędzie. Transparentność w tym miejscu to sygnał metodologicznej dojrzałości, nie słabości.


Jeśli piszesz pracę z badaniami jakościowymi i nie wiesz jeszcze jak zaplanować metodologię – sprawdź też [jak napisać rozdział metodologiczny pracy dyplomowej] oraz [jak pisac pracę licencjacką z AI].

 

Bibliografia:

  • Byłeń S., Metodyka pisania pracy dyplomowej na kierunku logistyka, Wyd. SAN, Łódź 2015.
  • Ess C., Grounding Internet Research Ethics 3.0: A view from (the) AoIR, [w:] Internet Research Ethics for the Social Age: New Challenges, Cases, and Contexts, [red.] M. Zimmer, K. Kinder-Kurlanda, Peter Lang, New York 2017.
  • European Commission (2025). ERA Living Guidelines on the Responsible Use of Generative AI in Research. European Commission, Directorate-General for Research and Innovation.
  • Hitch D., Artificial Intelligence Augmented Qualitative Analysis: The Way of the Future?, „Qualitative Health Research” 2024, vol. 34, nr 7.
  • Kovačević A., Bašaragin B., Milošević N., Nenadić G., De-identification of clinical free text using natural language processing: A systematic review of current approaches, „Artificial Intelligence in Medicine” 2024, vol. 151, art. 102845.
  • Patsakis C., Lykousas N., Man vs the machine in the struggle for effective text anonymisation in the age of large language models, „Scientific Reports” 2023, t. 13, nr 16026, https://pmc.ncbi.nlm.nih.gov/articles/PMC10519977/ [dostęp: 01.06.2026].
  • Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. w sprawie ochrony osób fizycznych w związku z przetwarzaniem danych osobowych, Dz.Urz. UE L 119 z 4.05.2016.
  • Tauginienė L., Artificial Intelligence in Qualitative Research Data Processing, [w:] Artificial Intelligence and Social Technologies in Research Conduct, [red.] L. Tauginienė, CRC Press 2026.