Metoda promptowania Chain-of-Thought

Chain-of-Thought (CoT) prompting to technika inżynierii promptów, której celem jest poprawa wydajności modeli językowych w zadaniach wymagających logiki, obliczeń i podejmowania decyzji. Technika ta polega na formułowaniu zapytania w taki sposób, by model językowy krok po kroku opisał swoje rozumowanie, co symuluje proces myślowy człowieka.

W standardowej wersji promptu użytkownik dodaje instrukcje typu „Opisz swoje rozumowanie krok po kroku” na końcu pytania. W ten sposób zmusza model do wygenerowania nie tylko końcowego wyniku, ale również pośrednich etapów, które prowadzą do odpowiedzi.

Jak działa Chain-of-Thought?

CoT działa poprzez wykorzystanie zdolności modeli językowych do generowania płynnego języka oraz symulację procesów poznawczych charakterystycznych dla ludzi, takich jak planowanie i rozumowanie sekwencyjne. Przykładowo, gdy napotykamy na skomplikowane zadanie matematyczne, zazwyczaj dzielimy je na mniejsze etapy, które pomagają dojść do prawidłowej odpowiedzi.

Chain-of-Thought prompting prosi model, aby naśladował ten proces, rozkładając problem na poszczególne kroki, co w praktyce oznacza „myślenie na głos”. W ten sposób model może stopniowo rozwiązywać problem, zamiast dostarczać bezpośredniej odpowiedzi, co często skutkuje lepszą precyzją.

Przykład promptu Chain-of-Thought

Przykład zastosowania CoT do rozwiązania kazusu (problemu) prawnego:

Zapytanie:

Rozwiąż podany niżej kazus prawny:

Stan faktyczny:
Jacek F. w dniu 4.1.2015 r., ok. godz. 2.00 brał udział w bójce pod dyskoteką „Guliwer” w P., w której uczestniczyli również Dawid G. i Bogdan D. oraz kilka innych osób. W trakcie zdarzenia Jacek F. kilkakrotnie uderzył butelką w głowę Bogdana D., powodując u niego liczne obrażenia twarzy, w tym złamanie nosa oraz utratę lewej gałki ocznej. Uczestniczący w zdarzeniu Dawid G., przyjaciel Bogdana D., widząc z odległości ok. 10 m zakrwawioną twarz kolegi, rzucił się z nożem w ręce w kierunku Jacka F.

W tym czasie Patrycja M., stojąca w grupie obserwujących całe zdarzenie koleżanek i do tej pory przyglądająca mu się biernie, podniosła leżącą na ziemi metalową rurkę długości ok. 80 cm i krzycząc „trzymaj”, rzuciła ją Jackowi F. Widok tak uzbrojonego przeciwnika powstrzymał Dawida G. przed atakiem. Do końca zajścia obaj pozostawali w odległości kilku metrów od siebie i przy użyciu wulgarnych słów wzywali się wzajemnie do podjęcia działań zaczepnych.
Czy Patrycja M. była uczestnikiem bójki?

Przedstaw swój proces rozumowania w odniesieniu do odpowiedzi na pytanie.

Model językowy odpowie, opisując każdy etap obliczeń, co ułatwia zrozumienie pełnego procesu.

Odpowiedź:

Wykorzystano ChatGPT-o1.

Aby ustalić, czy Patrycja M. była uczestnikiem bójki, należy najpierw zrozumieć, co oznacza „bójka” w rozumieniu Kodeksu karnego (KK).

Art. 158 KK definiuje bójkę jako zdarzenie, w którym co najmniej trzy osoby wzajemnie naruszają swoją nietykalność cielesną, angażując się w akty przemocy fizycznej.
Kluczowym elementem bójki jest wzajemność ataków między uczestnikami. Uczestnikami bójki są osoby, które aktywnie biorą udział w fizycznej konfrontacji, wymieniając ciosy lub inne formy agresji fizycznej.

Zachowanie Patrycji M.:

Początkowa postawa: Patrycja M. stała w grupie obserwatorów i biernie przyglądała się zdarzeniu, nie angażując się w żadne działania.
Działanie aktywne: W pewnym momencie podniosła metalową rurkę i, krzycząc „trzymaj”, rzuciła ją w kierunku Jacka F., który był zaangażowany w bójkę z Dawidem G.

Analiza prawna zachowania:

Brak bezpośredniego udziału w bójce:
- Patrycja M. nie brała udziału w fizycznej konfrontacji. Nie atakowała nikogo ani nie broniła się przed atakiem.
- Nie uczestniczyła w wymianie ciosów ani nie naruszyła czyjejkolwiek nietykalności cielesnej.
Czy dostarczenie narzędzia czyni ją uczestnikiem bójki?
- Samo dostarczenie narzędzia (metalowej rurki) nie oznacza automatycznie uczestnictwa w bójce.
- Uczestnictwo wymaga aktywnego zaangażowania w przemoc fizyczną.

Kwalifikacja prawna jej działania:

Pomocnictwo (Art. 18 § 3 KK):
- Zgodnie z art. 18 § 3 KK, pomocnikiem jest ten, kto w zamiarze, aby inna osoba dokonała czynu zabronionego, swoim zachowaniem ułatwia jej jego popełnienie.
- Rzucenie metalowej rurki Jackowi F. mogło ułatwić mu popełnienie przestępstwa, np. spowodowanie ciężkiego uszczerbku na zdrowiu.
- W ten sposób Patrycja M. mogła dopuścić się pomocnictwa do przestępstwa z art. 156 § 1 KK (spowodowanie ciężkiego uszczerbku na zdrowiu).

Zamiar i świadomość:

Subiektywna strona czynu:
- Aby przypisać Patrycji M. pomocnictwo, należy ustalić, czy działała z zamiarem bezpośrednim lub ewentualnym ułatwienia popełnienia przestępstwa.
- Jeśli przewidywała, że jej działanie może skutkować użyciem rurki do wyrządzenia komuś krzywdy, i godziła się na to, można mówić o zamiarze ewentualnym.

Orzecznictwo i doktryna:

Praktyka sądowa:
- Sąd Najwyższy w swoich orzeczeniach podkreśla, że uczestnictwo w bójce wymaga fizycznego zaangażowania w przemoc.
- Osoby, które jedynie wspierają uczestników bójki bez bezpośredniego udziału, mogą odpowiadać za inne przestępstwa, ale nie za udział w bójce.

Wnioski:

Patrycja M. nie była uczestnikiem bójki:
- Nie spełniła kryteriów bezpośredniego udziału w bójce zgodnie z art. 158 KK.
- Jej działanie nie polegało na fizycznej konfrontacji ani wymianie ciosów.
Odpowiedzialność za pomocnictwo:
- Poprzez dostarczenie narzędzia mogącego posłużyć do popełnienia przestępstwa, mogła dopuścić się pomocnictwa w spowodowaniu ciężkiego uszczerbku na zdrowiu (art. 18 § 3 KK w zw. z art. 156 § 1 KK).
- Konieczne jest jednak ustalenie jej zamiaru i świadomości co do skutków działania.

Podsumowanie:

Proces rozumowania prowadzi do konkluzji, że Patrycja M. nie była uczestnikiem bójki w rozumieniu art. 158 KK, ponieważ nie brała bezpośredniego udziału w fizycznej konfrontacji. Jej czyn polegający na dostarczeniu metalowej rurki może jednak stanowić podstawę do pociągnięcia jej do odpowiedzialności karnej za pomocnictwo w popełnieniu przestępstwa przeciwko zdrowiu.

Reasumując, Patrycja M. nie była uczestnikiem bójki, ale jej zachowanie może być kwalifikowane jako pomocnictwo w popełnieniu przestępstwa przez innego uczestnika zdarzenia.

Zalety metody

Lepsza precyzja odpowiedzi – Dzielenie skomplikowanych problemów na mniejsze etapy umożliwia modelowi językowemu dokładniejsze przetwarzanie poszczególnych elementów zadania.
Wykorzystanie szerokiej wiedzy – Modele językowe są trenowane na ogromnych zbiorach danych, które obejmują różnorodne wyjaśnienia, definicje i przykłady rozwiązywania problemów. Dzięki temu Chain-of-Thought Prompting pozwala im lepiej korzystać z zgromadzonej wiedzy.
Poprawa zdolności logicznego rozumowania – Chociaż modele językowe świetnie generują tekst, mogą mieć trudności z rozumowaniem logicznym. Chain-of-Thought Prompting pomaga przezwyciężyć te ograniczenia, kierując model na ścieżkę strukturalnego myślenia.
Przejrzystość procesu myślowego – Model jawnie przedstawia proces rozumowania, co ułatwia deweloperom identyfikację błędów w działaniu modelu i jego dalsze udoskonalanie.

Ograniczenia metody

Mimo licznych zalet, technika Chain-of-Thought nie jest pozbawiona ograniczeń. Należy pamiętać, że mimo iż model naśladuje strukturalne rozumowanie, nie oznacza to, że rzeczywiście „myśli”. Modele te są neuronowymi sieciami predykcyjnymi, które generują odpowiedzi na podstawie prawdopodobieństw występowania sekwencji tekstu.

Co więcej, Chain-of-Thought Prompting może prowadzić do błędnych odpowiedzi, jeśli dane, na których trenowany był model, zawierały nieścisłości lub luki. Istnieje również pytanie o skalowalność tej techniki, zwłaszcza w przypadku mniejszych modeli językowych, które mają mniej zasobów obliczeniowych.

Podsumowanie

Chain-of-Thought Prompting to potężne narzędzie, które może znacząco poprawić zdolności rozumowania modeli językowych. Dzięki tej technice modele mogą rozkładać złożone problemy na mniejsze etapy, co poprawia dokładność i precyzję odpowiedzi. Jednakże, mimo wielu korzyści, należy pamiętać o ograniczeniach tej techniki i realistycznie oceniać możliwości modeli językowych.

Częste pytania

Jakie są główne zalety metody Chain-of-Thought prompting?

Główne zalety metody Chain-of-Thought prompting to lepsza precyzja odpowiedzi, wykorzystanie szerokiej wiedzy modeli językowych, poprawa zdolności logicznego rozumowania oraz przejrzystość procesu myślowego. Dzięki dzieleniu skomplikowanych problemów na mniejsze etapy, modele mogą dokładniej przetwarzać poszczególne elementy zadania.

Czy Chain-of-Thought prompting zawsze prowadzi do poprawnych odpowiedzi?

Nie, Chain-of-Thought prompting nie zawsze prowadzi do poprawnych odpowiedzi. Technika ta może prowadzić do błędnych wyników, jeśli dane, na których trenowany był model, zawierały nieścisłości lub luki.

Jak działa Chain-of-Thought prompting w praktyce?

Chain-of-Thought prompting działa poprzez formułowanie zapytania w taki sposób, by model językowy krok po kroku opisał swoje rozumowanie. Dzięki temu model może stopniowo rozwiązywać problem, co często skutkuje lepszą precyzją.

Kiedy warto stosować metodę Chain-of-Thought prompting?

Metodę Chain-of-Thought prompting warto stosować w zadaniach wymagających logiki, obliczeń i podejmowania decyzji. Dzięki tej technice modele językowe mogą lepiej symulować procesy poznawcze charakterystyczne dla ludzi.

Jakie są ograniczenia metody Chain-of-Thought prompting?

Ograniczenia metody Chain-of-Thought prompting obejmują fakt, że modele nie myślą w sposób ludzki, a jedynie generują odpowiedzi na podstawie prawdopodobieństw. Istnieje również pytanie o skalowalność tej techniki w przypadku mniejszych modeli językowych.