AI በዩኒቨርሲቲ ፈተና፡ ፈጣን ነጥብና ግብረመልስ

አርቲፊሻል ኢንተሊጀንስ በትምህርትና በስልጠና ዘርፍ••By 3L3C

AI በprompt-based LLMs የዩኒቨርሲቲ ግምገማን እንዴት ፈጣን፣ ፍትሃዊ እና የሚማር ግብረመልስ ያደርጋል በተግባር ይመራዎታል።

LLMአውቶማቲክ ግምገማየተማሪ ግብረመልስRubricከፍተኛ ትምህርትAI ፖሊሲ
Share:

Featured image for AI በዩኒቨርሲቲ ፈተና፡ ፈጣን ነጥብና ግብረመልስ

AI በዩኒቨርሲቲ ፈተና፡ ፈጣን ነጥብና ግብረመልስ

2025 መጨረሻ ላይ ብዙ ዩኒቨርሲቲዎች አንድ ግልፅ ጭንቀት ውስጥ ናቸው፤ ተማሪዎች በቁጥር እየጨመሩ ነው፣ የግምገማ ስራ ግን በዚያ ፍጥነት አይከተልም። በተለይ የጽሁፍ መልስ (essay)፣ የሪፖርት እና የክፍት መልስ ፈተናዎች ውስጥ ነጥብ መስጠትና ጥራት ያለው ግብረመልስ መጻፍ ከባድ የሰዓት ወጪ ነው። ብዙ ጊዜ ተማሪዎች “ነጥብ አገኘን እንጂ የምንማርበትን ግብረመልስ አላገኘንም” ይላሉ።

እዚህ ላይ የprompt-based LLMs (በመመሪያ ጽሁፍ የሚመራ ትልቅ የቋንቋ ሞዴል) የሚገባው ቦታ ግልፅ ነው፤ ለፈተና ነጥብ እና ግብረመልስ ማብ生成 የተዘጋጀ የመመሪያ (prompt) በመጠቀም ሰዓታትን ለመቆጠብ እና የተማሪ መማርን በጥራት ለማሻሻል ይችላል። ይህ ጽሁፍ በእኛ የስርዓት ትርኢት “አርቲፊሻል ኢንተሊጀንስ በትምህርትና በስልጠና ዘርፍ” ውስጥ እንደ የጉዳይ ጥናት ተቀርቦ ነው፤ አስተማሪዎች ያላቸውን እውነተኛ ፍላጎቶች (ጊዜ፣ ፍትሃዊነት፣ የተማሪ እድገት) በመሳሰሉ ቦታዎች ላይ ምን እንደሚሰራ በተግባር እንነጋገራለን።

የሚታይ ችግኝት፡ ነጥብ አይደለም—ግብረመልስ ነው

መልስ በመጀመሪያ፦ አውቶማቲክ ነጥብ መስጠት ብቻ የትምህርት ምርጥ አላማ አይደለም፤ ተማሪ የሚያሻሽለው ነገር በተግባር የሚመራ ግብረመልስ ነው። ነጥብ እንደ ውሳኔ ይመጣል፤ ግብረመልስ ግን እንደ መንገድ ካርታ ይሰራል።

ከብዙ ኮርሶች ተሞክሮ የሚታየው፣ አስተማሪዎች የሚከፍሉት ሰዓት ከፍ እያለ ሲሄድ የግብረመልስ ጥራት ግን ወደ አጠቃላይ አስተያየት (“ጥሩ ነው/አሻሽል”) ይወርዳል። ይህ በተማሪ የመማር ፍላጎት ላይ እስከ መቀነስ ይድረስ ይችላል።

ለምን በከፍተኛ ትምህርት በጣም ይገልጻል?

መልስ በመጀመሪያ፦ ምክንያቱ የስራ መጠን እና የግምገማ አይነቶች ብዛት ነው። ዩኒቨርሲቲ ውስጥ ሪፖርት፣ የምርምር አቀራረብ፣ ኮድ ስራ፣ ክርክር ጽሁፍ፣ ምሳሌ በምሳሌ መልስ ያሉ አይነቶች ሁሉ የሚጠይቁት እንጂ በቀላሉ እርስ በርስ የሚመዘኑ አይደሉም።

Prompt-based LLMs በግምገማ ላይ እንዴት ይሰራሉ?

መልስ በመጀመሪያ፦ ትክክለኛ እና ጥልቅ መመሪያ (prompt) ሲሰጥ፣ LLM የተማሪ መልስን ከrubric ጋር ይያያዛል፣ ነጥብ ይጠቅማል እና ተግባራዊ ግብረመልስ ያቀርባል—እንደ “ምን ደረጃ ላይ ነህ?” “ምን ይጎድልሃል?” “ቀጣዩ ምን ነው?”

ቁልፉ ቃል “prompt-based” ነው። ሞዴሉ እንደ አስተማሪ አእምሮ አይተው አይሰራም፤ እርስዎ እንዲሰራ የምትፈልጉትን የግምገማ አቅጣጫ እና መደበኛነት በግልፅ መመሪያ ላይ ሲያስገቡ ነው። እኔ የማየው፣ አብዛኛው ቡድን እዚህ ይሳሳታል፤ “እነሆ የተማሪ መልስ—አስተያየት ስጥ” ብሎ ይተዋል። ይህ አጠቃላይ እና የማይመዘን መልስ ያመጣል።

የመመሪያ (prompt) ውስጥ ሊኖሩ የሚገቡ ነገሮች

መልስ በመጀመሪያ፦ ለአውቶማቲክ ስኮሪንግ እና ግብረመልስ ጥራት 80% የሚወስነው የprompt ግልፅነት ነው። ተግባራዊ እቅድ፦

  1. Rubric በግልፅ ማስገባት: መደብ (Criteria)፣ ክብደት (Weight)፣ የደረጃ መግለጫ (Descriptors)። ለምሳሌ፦ አመለካከት 30%፣ ማስረጃ 40%፣ አወቃቀር 20%፣ ቋንቋ 10%።
  2. የውጤት ቅርጽ መግለጥ: በነጥብ ሰንጠረዥ + 3-5 ነጥብ ያላቸው ማሻሻያዎች + 1 የተወሰነ ምሳሌ ምክር።
  3. የቋንቋ መመሪያ: ግብረመልስ በአማርኛ እንዲሆን፣ የማይወርድ/የማያነሳ ቃላት እንዲጠቀም፣ “ማድረግ የሚችሉት” ቋንቋ እንዲጠቀም።
  4. የውሳኔ ወሰን: ካልተገኘ መረጃ እንዳይፈጥር፣ “አልተጠቀሰም” ብሎ እንዲግለጽ።

ቀላል መርሀ ግብር፦ “Rubric ያለ ግምገማ እንደ መለኪያ ያለ ሚዛን ነው።”

አውቶማቲክ ነጥብ ከግብረመልስ ጋር ሲያገናኝ የሚሰጥ እሴት

መልስ በመጀመሪያ፦ ትልቁ እሴት የሚመጣው ፍጥነት + መደበኛነት + ግላዊ መመሪያ በአንድ ጥቅል ሲገናኙ ነው። ነጥብ ብቻ አይበቃም፣ ግብረመልስ ብቻም ካልተመዘነ ጭራሽ ይሆናል። ሁለቱ አንድ ሲሆኑ ተማሪዎች በቀጣዩ እቃ ላይ በትክክል የሚሞክሩትን ነገር ያውቃሉ።

በክፍል ውስጥ ተግባራዊ ምሳሌ (የሚተገበር እቅድ)

መልስ በመጀመሪያ፦ አስተማሪው እንደ “ሁለት-ደረጃ ግምገማ” ካደረገው የሚያገኘው ጥራት ከፍ ይላል።

  1. ደረጃ 1 (LLM ቅድመ-ግምገማ): ሞዴሉ ነጥብ ይጠቅማል፣ የrubric መደቦች ላይ ጉድለት/ኃይል ይለያል፣ የማሻሻያ ነጥቦች ይሰጣል።
  2. ደረጃ 2 (የአስተማሪ ማረጋገጫ): አስተማሪው በፍጥነት ይመርምራል፣ የማይተማመንበትን ክፍል ያስተካክላል፣ አንድ ወይም ሁለት በጣም የሚመሩ ሐሳቦች ይጨምራል።

እንዲህ ሲሆን ተማሪው አስተማሪ ያለበትን ድምጽ ይሰማል፣ አስተማሪው ደግሞ በ“ቅጽ ስራ” ላይ እንጂ በ“አእምሮ ስራ” ላይ ጊዜውን አያቃጥልም።

የግላዊ መማሪያ መንገድ ለመፍጠር የሚረዳ ነጥብ

መልስ በመጀመሪያ፦ LLM ግብረመልስ በተማሪ ስህተት አይነት ላይ ሲያደግ የግላዊ መማሪያ መንገድ ይፈጠራል። ለምሳሌ፣ “ማስረጃ ማቅረብ ይደክማል” ብሎ የሚያገኘው ተማሪ ቀጣዩ ስራ ላይ የማስረጃ አይነቶች (ምስክርነት፣ ቁጥር መረጃ፣ ምሳሌ ጥናት) እንዲያስገባ በቀጥታ መመሪያ ይቀበላል።

የአደጋ ነጥቦች፡ ፍትሃዊነት፣ ተዓማኒነት እና ግላዊነት

መልስ በመጀመሪያ፦ አውቶማቲክ ስኮሪንግ አይነት ፕሮጀክት ከመጀመርዎ በፊት ሶስት ጉዳዮችን በድንጋይ ላይ መጻፍ አለብዎት፤ ፍትሃዊነት (fairness)፣ ተዓማኒነት (reliability)፣ ግላዊነት (privacy)።

1) ፍትሃዊነት (Bias) እንዴት ይታያል?

መልስ በመጀመሪያ፦ ሞዴሉ የቋንቋ ደረጃ፣ የመጻፍ ቅርጽ ወይም ባህላዊ ንግግር ልዩነት ላይ አይፈርድ ዘንድ መከላከያ ይፈልጋል። ተግባራዊ መከላከያዎች፦

  • በrubric ውስጥ “ይዘት እና አስተሳሰብ” ከ“ቋንቋ ንፅህና” ማለያየት
  • ከተለያዩ የተማሪ ምሳሌዎች ጋር የprompt ሙከራ
  • በተወሰኑ ክፍሎች ላይ የአስተማሪ ግዴታዊ ግምገማ (human-in-the-loop)

2) ተዓማኒነት፡ ሞዴሉ ተመሳሳይ መልስ ለተመሳሳይ ስራ ይሰጣል?

መልስ በመጀመሪያ፦ ተዓማኒነት ማለት ተመሳሳይ ስራዎች ላይ ተመሳሳይ መለኪያ መስጠት ነው። እሱን ለማረጋገጥ፦

  • 10-20 የተለያዩ መልሶች ላይ የ“የመጀመሪያ ሙከራ” መደበኛ ምርመራ
  • የአስተማሪ ነጥብ እና የLLM ነጥብ መካከል ልዩነት ከተወሰነ ገደብ በላይ ሲሆን እንዲታይ መደንበር
  • ትክክለኛ የመውጫ ቅርጽ (output format) መጠበቅ

3) ግላዊነት እና የውሂብ ጥበቃ

መልስ በመጀመሪያ፦ የተማሪ ስራ በአጠቃላይ የግል ውሂብ ሊይዝ ይችላል፤ ስም፣ መለያ ቁጥር፣ እንኳን የግል ታሪክ ሊገባ ይችላል። ስለዚህ፦

  • በሞዴል ላይ ከመጫን በፊት ስም/መለያ ማጥፋት (anonymization)
  • የተማሪ ሾል ለመጠቀም ግልፅ ፖሊሲ እና ፈቃድ ማዘጋጀት
  • የክፍል ውስጥ አጠቃቀም መደበኛ መመሪያ (እንደ “ምን እንጨምር/ምን አናስገባ”)

የመጀመሪያ 90 ቀን እቅድ፡ ትንሽ ጀምሮ ትክክል ማድረግ

መልስ በመጀመሪያ፦ አውቶማቲክ ስኮሪንግ ለመጀመር ሙሉ ኮርስ ለመቀየር አያስፈልግም፤ ትንሽ ሙከራ ብቻ በግልፅ መለኪያ ላይ ይመራ።

ቀን 1-15፦ ተግባር ለመደረግ የሚያበቃ ዝግጅት

  • አንድ አሰይ ወይም አንድ ሪፖርት ክፍል ይምረጡ (ለምሳሌ 200-400 ቃላት)
  • rubric ያጠናክሩ (መለኪያ እና የምሳሌ መልሶች)
  • የprompt እቅድ ያበርኩ (የምትፈልጉት ውጤት ቅርጽ)

ቀን 16-45፦ ሙከራ እና መነጻጸር

  • 20 ስራዎች ላይ LLM እና አስተማሪ በተለይ ይምዘኑ
  • ልዩነት በጣም የሚበልጥባቸውን አይነቶች ይለዩ (ለምሳሌ አወቃቀር አይነት)
  • prompt በእነዚህ ላይ እንዲሻሻል ይቀይሩ

ቀን 46-90፦ ክፍል ውስጥ መደበኛ መጠቀም

  • ለአስተማሪ የማረጋገጫ ሂደት ይዘጋጁ (እንደ “10% ስራዎች በእጅ ሙሉ ምርመራ”)
  • ለተማሪዎች ግልፅ ይሁን፦ AI ምን እያደረገ ነው? አስተማሪ ምን ይፈትሻል?
  • ግብረመልስን ወደ እርምጃ ይቀይሩ፦ ተማሪዎች የሚያደርጉትን የ“እንደገና ማቅረብ” እድል ይጨምሩ

ተደጋጋሚ ጥያቄዎች (አጭር እና ግልፅ)

LLM አስተማሪን ይተካል?

መልስ በመጀመሪያ፦ አይተካም። የሚያደርገው የ“ቅድመ-ግምገማ” እና የግብረመልስ መርሀ ግብር ማረጋገጥ ነው፤ የመጨረሻ ውሳኔ በአስተማሪ መቆየት አለበት።

ተማሪዎች እንዳይወስዱት እንዴት እንከላከላለን?

መልስ በመጀመሪያ፦ ግብረመልስን “ሂደት” ላይ ካደረጉት ችግኝቱ ይቀንሳል። ለምሳሌ የረቂቅ ስራ (draft) ማቅረብ፣ የምንጭ መረጃ መግለጥ፣ ክፍል ውስጥ አጭር አቀራረብ (viva) ያሉ የሂደት ዝርዝሮች በማስገባት ነው።

የአማርኛ መልሶች ላይ ይሰራል?

መልስ በመጀመሪያ፦ አዎ—ግን በrubric እና በprompt ግልፅነት ላይ ጥረት ይፈልጋል። በተለይ የአካባቢ ቃላት/አገላለጾች እና የስርዓተ-ነጥብ ልዩነት ሲገባ የማረጋገጫ ደረጃ ከፍ ይላል።

የሚያስቀር ሐሳብ፡ ግምገማን ወደ መማር መመለስ

የprompt-based LLMs ትርጉም አንድ ነገር ነው፤ ግምገማን እንደ “መጨረሻ ፍርድ” ከማየት ወደ “ቀጣይ እርምጃ መመሪያ” መመለስ። ይህ በትምህርትና በስልጠና ዘርፍ የAI ዋና ጥቅም ነው—የግላዊ መማሪያ መንገድ እንዲፈጠር እና አስተማሪዎች በሰው ብቃት የሚፈለጉ ቦታዎች ላይ እንዲቆዩ።

ለመጀመር ትንሽ ይበቃል፤ አንድ ክፍል፣ አንድ rubric፣ አንድ ግልፅ prompt፣ እና የአስተማሪ ማረጋገጫ መደበኛ ሂደት። ከዚያ በኋላ የሚለው ጥያቄ ይቀር፦ በእርስዎ ትምህርት ቤት ግምገማ በፍጥነት ብቻ ይሻሻላል—ወይስ ተማሪዎች በእውነት እንዲማሩ ይረዳል?