ইন্দ্রিয়তন্ত্র/দৃষ্টি সংকেত প্রক্রিয়াকরণ

সংকেত প্রক্রিয়াকরণ

সম্পাদনা

পূর্বে উল্লেখ করা হয়েছে যে চোখের সবচেয়ে গুরুত্বপূর্ণ অংশ হলো রেটিনা কারণ এতে সমস্ত আলোক-সংবেদনশীল কোষ থাকে। রেটিনা ছাড়া চোখকে একটি ডিজিটাল ক্যামেরার সঙ্গে তুলনা করা যায়, যেখানে CCD (চার্জ কাপলড ডিভাইস) সেন্সর নেই। এই অংশে ব্যাখ্যা করা হয়েছে কীভাবে রেটিনা আলো গ্রহণ করে, কীভাবে অপটিক্যাল সংকেত মস্তিষ্কে পৌঁছে এবং কীভাবে মস্তিষ্ক সেই সংকেত প্রক্রিয়াকরণ করে সিদ্ধান্ত গ্রহণের জন্য উপযুক্ত তথ্য তৈরি করে।

প্রাথমিক সংকেতের সৃষ্টি: ফটোসেন্সর কার্যপ্রণালী

সম্পাদনা

দৃষ্টি শুরু হয় তখনই যখন আলো রেটিনার আলোক-সংবেদনশীল কোষে পড়ে। রেটিনার রড ও কোন কোষে থাকা আলোক-শোষণকারী রঞ্জক পদার্থ ও বিভিন্ন এনজাইম এবং ট্রান্সমিটার দৃশ্যমান তড়িচ্চুম্বকীয় উদ্দীপনাকে বৈদ্যুতিক সংকেতে রূপান্তর শুরু করে। এই প্রক্রিয়াটিকে বলা হয় ফটোইলেকট্রিক ট্রান্সডাকশন। রড কোষের উদাহরণ ধরে বলা যায় দৃশ্যমান আলো রডের বাইরের ডিস্ক গঠনে থাকা রডোপসিন নামক ট্রান্সমেমব্রেন অণুর ওপর পড়ে। প্রতিটি রডোপসিন অণুতে কয়েকটি হেলিক্স থাকে যেগুলোর সমষ্টিকে বলা হয় ওপসিন। এই ওপসিনকে ঘিরে রাখে ১১-সিস রেটিনাল নামক একটি অংশকে যা ফোটনের শক্তি গ্রহণ করে আকার পরিবর্তন করে। জীববিজ্ঞানে এ ধরনের অংশ যা আলোর শক্তিতে গঠনগত পরিবর্তন ঘটায় তাকে বলা হয় ক্রোমোফোর।১১-সিস রেটিনাল আলোর শক্তিতে সোজা হয়ে যায় এবং পরিণত হয় অল-ট্রান্স রেটিনালে। এতে ওপসিন হেলিক্সগুলো একে অপর থেকে দূরে সরে যায় এবং কিছু প্রতিক্রিয়াশীল স্থল উন্মুক্ত হয়। এই সক্রিয় রডোপসিন অণুকে বলা হয় মেটারডোপসিন II। একবার সক্রিয় হয়ে গেলে, আলো না থাকলেও এই বিক্রিয়া চলতে থাকে।এই মেটারডোপসিন II প্রায় ১০০টি ট্রান্সডিউসিন নামক Gs প্রোটিনের অণুর সাথে প্রতিক্রিয়া করে। এতে GDP রূপান্তরিত হয়ে GTP হয় এবং উৎপন্ন হয় as ও ß? উপাদান। সক্রিয় as-GTP এরপর cGMP-ফসফোডাইএস্টারেজ (PDE)-এর সাথে যুক্ত হয়, যা সাধারণ আয়ন বিনিময় কার্যক্রমকে বাধাগ্রস্ত করে। এর ফলে কোষের সাইটোসলে ক্যাটায়ন ঘনত্ব কমে যায় এবং কোষের মেমব্রেনের পোলারাইজেশন পরিবর্তিত হয়।

এই প্রাকৃতিক ফটোইলেকট্রিক ট্রান্সডাকশন বিক্রিয়ার বিস্ময়কর এক শক্তি রয়েছে। একক একটি রডোপসিন অণু, একটি কোয়ান্টাম আলোর দ্বারা সক্রিয় হয়ে প্রতি সেকেন্ডে প্রায় ১০ টি cGMP অণু হাইড্রোলাইসিস করতে পারে।

ফটো ট্রান্সডাকশন

সম্পাদনা
 
রড কোষের বাইরের ডিস্ক ঝিল্লিতে ফটোসক্রিয়তার আণবিক ধাপসমূহের চিত্রণ (Leskov et al., 2000 থেকে পরিবর্তিত)। ধাপ ১: ফোটন (hν) রডোপসিনে শোষিত হয়ে এটিকে সক্রিয় করে, যার ফলে এটি গঠনগতভাবে পরিবর্তিত হয়ে R* হয়। ধাপ ২: R* বারবার ট্রান্সডিউসিন অণুর সংস্পর্শে এসে এটিকে সক্রিয় করে G* এ রূপান্তর করে, যেখানে এটি GDP ছেড়ে GTP গ্রহণ করে (ধাপ ৩)। G* এর α এবং γ উপাদান PDE এর ইনহিবিটরি γ উপাদানকে বাঁধে এবং PDE এর α ও ß উপাদান সক্রিয় হয়। ধাপ ৪: সক্রিয় PDE cGMP হাইড্রোলাইসিস করে। ধাপ ৫: গয়ানিল সাইক্লেজ (GC) নতুন করে cGMP তৈরি করে। সাইটোসলে cGMP এর পরিমাণ কমে গেলে, সাইক্লিক নিউক্লিওটাইড গেইটেড চ্যানেল বন্ধ হয়ে যায় এবং Na+ ও Ca2+ প্রবেশ বন্ধ হয়।
  1. একটি আলোর ফোটন রেটিনাল-এর সাথে আলোকগ্রাহী কোষ কোষে প্রতিক্রিয়া করে। এতে আইসোমারেশন ঘটে এবং এটি ১১-সিস থেকে অল-ট্রান্স গঠনে রূপান্তরিত হয়।
  2. রেটিনাল এরপর ওপসিনের বাঁধার স্থানে আর মানানসই থাকে না।
  3. ফলে ওপসিন গঠনগতভাবে পরিবর্তিত হয়ে মেটারডোপসিন II-এ রূপ নেয়।
  4. মেটারডোপসিন II অস্থির অবস্থায় থাকে এবং ভেঙে যায়, ফলে তৈরি হয় ওপসিন ও অল-ট্রান্স রেটিনাল।
  5. ওপসিন এরপর নিয়ন্ত্রণকারী প্রোটিন ট্রান্সডিউসিন সক্রিয় করে। এতে ট্রান্সডিউসিন GDP ত্যাগ করে GTP ধারণ করে এবং এর α উপাদান ß ও γ উপাদান থেকে আলাদা হয়।
  6. α উপাদান-যুক্ত GTP কমপ্লেক্স ফসফোডাইএস্টারেজ সক্রিয় করে।
  7. ফসফোডাইএস্টারেজ cGMP ভেঙে ৫-GMP তৈরি করে। এতে cGMP এর ঘনত্ব কমে যায় এবং সোডিয়াম চ্যানেল বন্ধ হয়ে যায়।
  8. সোডিয়াম চ্যানেল বন্ধ হলে কোষ হাইপারপোলারাইজড হয়, কারণ পটাসিয়াম প্রবাহ চলতে থাকে।
  9. কোষ হাইপারপোলারাইজড হলে ভোল্টেজ-গেটেড ক্যালসিয়াম চ্যানেল বন্ধ হয়ে যায়।
  10. ক্যালসিয়ামের পরিমাণ কমে গেলে কোষের নির্গত নিউরোট্রান্সমিটার গ্লুটামেটের পরিমাণও কমে যায়। কারণ গ্লুটামেট সমৃদ্ধ ভেসিকলগুলোর ঝিল্লির সাথে যুক্ত হতে ক্যালসিয়াম প্রয়োজন।
  11. গ্লুটামেটের পরিমাণ কমে যাওয়ার ফলে কেন্দ্রিয় বাইপোলার কোষ (রড ও কোন উভয়) ডিপোলারাইজড হয় এবং অকেন্দ্রিক কোন বাইপোলার কোষ হাইপারপোলারাইজড হয়।

যখন চোখে দৃশ্যমান তড়িচ্চুম্বকীয় উদ্দীপনা থাকে না, তখন রড কোষে বিভিন্ন আয়ন, প্রোটিন ও অণুর মিশ্রণে প্রায় -৪০ মিলিভোল্ট মেমব্রেন বিভব থাকে। অন্যান্য স্নায়ুকোষের তুলনায় এটি অনেক বেশি (প্রায় -৬৫ মিলিভোল্ট)। এই অবস্থায় অ্যাকসন প্রান্ত থেকে গ্লুটামেট নামক নিউরোট্রান্সমিটার নিরবিচারে নিঃসরণ হয় এবং পাশের বাইপোলার কোষগুলো তা গ্রহণ করে। কিন্তু আলো আসার পর এবং পূর্বে বর্ণিত বিক্রিয়া শুরু হলে, মেমব্রেন বিভব কমে -৭০ মিলিভোল্টে পৌঁছায়। এই হাইপারপোলারাইজেশন গ্লুটামেটের নিঃসরণ কমিয়ে দেয় এবং এর ফলে বাইপোলার কোষের কার্যক্রম প্রভাবিত হয়, যা পরবর্তী দৃষ্টিপথের ধাপগুলিকে প্রভাবিত করে।

একই প্রক্রিয়া কোন কোষ এবং আলোক-সংবেদনশীল গ্যাংগ্লিয়ন কোষেও ঘটে, তবে সেখানে ভিন্ন ভিন্ন ওপসিন ব্যবহৃত হয়। তিন ধরনের কোন কোষে যথাক্রমে ফোটোপসিন I (হালকা সবুজাভ-হলুদ), II (সবুজ) ও III (নীল-বেগুনি) থাকে এবং গ্যাংগ্লিয়ন কোষে মেলানোপসিন (নীল) উপস্থিত থাকে।

রেটিনায় সংকেত প্রক্রিয়াকরণ

সম্পাদনা
 

বিভিন্ন বাইপোলার সেল মুক্ত হওয়া গ্লুটামেটের পরিমাণ এই পরিবর্তনের প্রতি ভিন্নভাবে সাড়া দেয়। কোন সেল থেকে বাইপোলার সেলে সরাসরি সংকেত প্রবাহ গঠনের জন্য যেসব বাইপোলার সেল ব্যবহৃত হয় তাদের বলা হয় অন এবং অফ বাইপোলার সেল। অন বাইপোলার সেল দৃশ্যমান ইলেক্ট্রোম্যাগনেটিক (EM) উদ্দীপনার ফলে ডিপোলারাইজড হয় এবং সংশ্লিষ্ট অন গ্যাংগ্লিয়ন সেল সক্রিয় হয়। অপরদিকে, অফ বাইপোলার সেল একই EM উদ্দীপনার ফলে হাইপারপোলারাইজড হয় এবং অফ গ্যাংগ্লিয়ন সেল দমন হয়। এটিই সরাসরি সংকেত প্রবাহের মৌলিক পথ। ল্যাটারাল সংকেত প্রবাহ শুরু হয় রড সেল থেকে। এরপর তা যায় বাইপোলার সেলে, তারপর অ্যামাক্রিন সেলে। রড-অ্যামাক্রিন সেলের মাধ্যমে অফ বাইপোলার সেল দমন হয় এবং অন বাইপোলার সেল সক্রিয় হয় একটি বৈদ্যুতিক সিন্যাপ্সের মাধ্যমে। সব ধাপ সম্পন্ন হলে সংকেত পৌঁছে যায় অন বা অফ গ্যাংগ্লিয়ন সেলে, এবং এইভাবে সম্পূর্ণ ল্যাটারাল সংকেত প্রবাহের পথ গঠিত হয়।

যখন দৃশ্যমান EM উদ্দীপনা অন গ্যাংগ্লিয়ন সেলে অ্যাকশন পোটেনশিয়াল (AP) সৃষ্টি করে, তখন সেন্সর পোটেনশিয়াল বৃদ্ধির সঙ্গে সঙ্গে AP-এর ঘনত্বও বাড়ে। অর্থাৎ, AP নির্ভর করে সেন্সর পোটেনশিয়ালের মাত্রার ওপর।গ্যাংগ্লিয়ন সেলের চারপাশে যে অঞ্চলে উদ্দীপক ও প্রতিবন্ধক প্রভাব AP-এর ঘনত্বকে প্রভাবিত করে, সেই অঞ্চলকে বলা হয় রিসেপ্টিভ ফিল্ড (RF)। সাধারণত এই RF-এর দুটি অংশ থাকে—একটি কেন্দ্রীয় অঞ্চল এবং একটি বৃত্তাকার প্রান্তীয় অঞ্চল। দৃশ্যমান EM অভিযোজনের সময় এদের মধ্যে পার্থক্য বোঝা যায়।কেন্দ্রীয় অঞ্চলে আলো পড়লে AP-এর ঘনত্ব বেড়ে যায়, আর প্রান্তীয় অঞ্চলে পড়লে তা কমে যায়। যখন আলো নিভিয়ে দেওয়া হয়, তখন উত্তেজনা সৃষ্টি হয়। তাই কেন্দ্রীয় অঞ্চলকে বলা হয় অন ফিল্ড। অন্যদিকে অফ গ্যাংগ্লিয়ন সেলের RF ঠিক এর বিপরীতভাবে কাজ করে, তাই এটিকে বলা হয় অফ ফিল্ড। এই RF গুলো গঠিত হয় হরিজন্টাল সেলের মাধ্যমে। প্রান্তীয় অঞ্চলে উদ্দীপনা শুরু হয়ে তা কেন্দ্রীয় অঞ্চলে পৌঁছায়, যেখানে "উদ্দীপনার বৈসাদৃশ্য" গঠিত হয়। এই বৈশিষ্ট্যটি অন্ধকারকে আরও অন্ধকার এবং আলোকিত অংশকে আরও উজ্জ্বল দেখায়। যদি পুরো RF এ আলো পড়ে, তাহলে কেন্দ্রীয় অঞ্চলের উদ্দীপনাই প্রাধান্য পায়।

কর্টেক্সে সংকেত পরিবহন

সম্পাদনা

আগে যেমন বলা হয়েছে গ্যাংগ্লিয়ন সেলের অক্ষপ্রান্তগুলি রেটিনার অপটিক ডিস্কে একত্রিত হয়ে অপটিক নার্ভ গঠন করে। এই তন্তুগুলো বান্ডেলের মধ্যে নির্দিষ্ট বিন্যাসে থাকে। রেটিনার ম্যাকুলার অঞ্চল থেকে আসা তন্তুগুলো কেন্দ্রস্থলে থাকে আর রেটিনার টেম্পোরাল অংশ থেকে আসা তন্তুগুলো বাইরের দিকে থাকে। যখন এই তন্তুগুলো চোখের গহ্বর ছেড়ে বের হয়। তখন আংশিক ক্রসিং বা পারস্পরিক অদলবদল ঘটে।প্রতিটি রেটিনার নাসাল অর্ধাংশ থেকে আসা তন্তুগুলো বিপরীত দিকে চলে যায় এবং মস্তিষ্কে পৌঁছে। কিন্তু টেম্পোরাল অর্ধাংশ থেকে আসা তন্তুগুলো একপাশেই থাকে। এই আংশিক অদলবদলকে বলা হয় অপটিক কায়াজমা। কায়াজমা অতিক্রম করার পর অপটিক নার্ভগুলোকে বলা হয় অপটিক ট্র্যাক্ট।এই নামকরণ গুলো করা হয়েছে যেন একচোখা নার্ভ থেকে পৃথক করে বোঝা যায়।এই আংশিক অদলবদলের কাজ হলো উভয় চোখ দ্বারা তৈরি ডান পাশের দৃশ্য ক্ষেত্র কেবল মস্তিষ্কের বাম পাশে পৌঁছায় এবং বাম পাশের দৃশ্য ক্ষেত্র ডান পাশে যায়। ফলে শরীরের ডান পাশ থেকে প্রাপ্ত সমস্ত তথ্য এবং ডান দৃষ্টিক্ষেত্রের তথ্য মস্তিষ্কের বাম পাশে যায়, যখন তা সম্মুখ মস্তিষ্কের পেছনের অংশে (ডায়েন্সেফালন) পৌঁছায়।

 
কেন্দ্রীয় কর্টেক্সে যাওয়ার পথ

অপটিক ট্র্যাক্টের তন্তু এবং স্নায়ুকোষের মধ্যে তথ্য বিনিময় ঘটে লেটারাল জেনিকুলেট বডিতে, যা মস্তিষ্কের থ্যালামাসে অবস্থিত এবং দৃষ্টিসংক্রান্ত সংকেত প্রক্রিয়াকরণের কেন্দ্রীয় কেন্দ্র। এখান থেকে তথ্য চলে যায় সংশ্লিষ্ট পাশের অক্সিপিটাল কর্টেক্সের স্নায়ুকোষে।রেটিনা থেকে মস্তিষ্কে যাওয়া সংযোগকে দুটি পথে ভাগ করা যায় 'পারভোসেলুলার পথ' ও 'ম্যাগনোসেলুলার পথ'। পারভোসেলুলার পথ রঙ এবং সূক্ষ্ম বিবরণ সংকেত দেয়, আর ম্যাগনোসেলুলার পথ দ্রুত চলমান উদ্দীপনাকে শনাক্ত করে।

 
রেটিনা থেকে মস্তিষ্কে সংযোগকে দুটি পথে ভাগ করা যায়"পারভোসেলুলার পথ" ও "ম্যাগনোসেলুলার পথ"। পারভোসেলুলার পথ শুরু হয় রেটিনার মিজেট সেল থেকে এবং এটি রঙ ও সূক্ষ্ম বিশদ বর্ণনা করে ম্যাগনোসেলুলার পথ শুরু হয় প্যারাসল সেল থেকে এবং এটি দ্রুত চলমান উদ্দীপনা শনাক্ত করে।

স্ট্যান্ডার্ড ডিজিটাল ক্যামেরা থেকে আসা সংকেত আনুমানিকভাবে পারভোসেলুলার পথের মতো আচরণ করে। পারভোসেলুলার পথের সাড়া অনুকরণ করতে গবেষকরা নিউরোমরফিক সেন্সরি সিস্টেম তৈরি করছেন, যেগুলো নিউরাল সিস্টেমে স্পাইক-ভিত্তিক গণনার অনুকরণ করে। এই উদ্দেশ্যে তারা "অ্যাড্রেস-ইভেন্ট রিপ্রেজেন্টেশন" নামের একটি স্কিম ব্যবহার করে নিউরোমরফিক ইলেকট্রনিক সিস্টেমে সংকেত প্রেরণ করে থাকে। [১])।

গঠনগতভাবে রেটিনার ম্যাগনো ও পারভো গ্যাংগ্লিয়ন সেল যথাক্রমে লেটারাল জেনিকুলেট নিউক্লিয়াস (LGN) এর ২টি ভেন্ট্রাল ম্যাগনোসেলুলার স্তরে এবং ৪টি ডরসাল পারভোসেলুলার স্তরে সংকেত প্রেরণ করে।LGN-এর এই ৬টি স্তর প্রতিটিই একই পাশের চোখ বা বিপরীত পাশের চোখ থেকে ইনপুট গ্রহণ করে। যেমন বাম চোখের গ্যাংগ্লিয়ন সেল ডান LGN-এর স্তর ১, ৪ ও ৬ এ যায় এবং ডান চোখের গ্যাংগ্লিয়ন সেল (ক্রসিং না করে) তার স্তর ২, ৩ ও ৫ এ যায়।এইভাবে ডান ও বাম চোখের তথ্য পৃথকভাবে রাখা হয়।

যদিও মানবদৃষ্টি রেটিনার দুই অর্ধাংশ দ্বারা একত্রিত হয় এবং সংকেত মস্তিষ্কের বিপরীত গোলার্ধে প্রক্রিয়াজাত হয়, তবুও সম্পূর্ণ দৃষ্টিক্ষেত্র একটি মসৃণ এবং পরিপূর্ণ একক হিসাবে বিবেচিত হয়। এই কারণে দুটি ভিজ্যুয়াল কর্টিকাল এলাকা ঘনিষ্ঠভাবে সংযুক্ত থাকে বলে মনে করা হয়। এই সংযোগকে বলা হয় কর্পাস ক্যালোসাম যা নিউরন, অ্যাকসন ও ডেনড্রাইট দিয়ে গঠিত। ডেনড্রাইটগুলো যখন দুই গোলার্ধের সংশ্লিষ্ট বিন্দুগুলোর মধ্যে সিন্যাপটিক সংযোগ তৈরি করে। তখন এক পাশের গোলার্ধে যেকোনো বিন্দুতে বৈদ্যুতিক উদ্দীপনা দিলে অপর পাশের সংযুক্ত বিন্দুতেও উদ্দীপনা তৈরি হয়। এই নিয়মের একমাত্র ব্যতিক্রম হলো প্রাইমারি ভিজ্যুয়াল কর্টেক্স।

অপটিক ট্র্যাক্ট লেটারাল জেনিকুলেট বডির নির্দিষ্ট স্তরে সিন্যাপ্স তৈরি করে। এরপর এই তৃতীয়-স্তরের স্নায়ুকোষের অ্যাকসন চলে যায় সেরিব্রাল কর্টেক্সের প্রতিটি অক্সিপিটাল লোবের ক্যালক্যারাইন ফিশারে। রেটিনার স্নায়ুকোষ থেকে আগত সাদা তন্তু ও অ্যাকসন যেহেতু এখান দিয়ে যায়, তাই এটিকে স্ট্রিয়েট কর্টেক্স বলা হয়। যা আমাদের প্রাথমিক ভিজ্যুয়াল কর্টেক্স অন্যভাবে V1 নামেও পরিচিত। এই পর্যায়ে পৃথক চোখ থেকে আসা সংকেত অভিন্ন কর্টিকাল নিউরনে মিলিত হয়। এর ফলে উভয় চোখের তথ্য একত্রে বিশ্লেষণ ও অনুধাবনের জন্য ব্যবহার করা সম্ভব হয়।

প্যাটার্ন শনাক্তকরণ এই মস্তিষ্ক অংশের একটি গুরুত্বপূর্ণ কাজ। এই অঞ্চলে ক্ষতি হলে চেনার সমস্যা বা ব্লাইন্ডসাইটের মতো জটিলতা দেখা দিতে পারে। চোখের পর্দা থেকে শুরু করে পার্শ্বীয় জেনিকুলেট কোষ পর্যন্ত যে ক্রমবদ্ধ উপায়ে অপটিক রজ্জুর তন্তুগুলি তথ্য পাঠায় এবং তারপর তা সরল খাঁজযুক্ত অঞ্চলে পৌঁছে দেয়, সেই ভিত্তিতে যদি চোখের পর্দার একটি নির্দিষ্ট বিন্দুতে উদ্দীপনা সৃষ্টি করা হয়, তাহলে পার্শ্বীয় জেনিকুলেট দেহ এবং সরল খাঁজযুক্ত মস্তিষ্কপ্রান্তে বিদ্যুতচালিত প্রতিক্রিয়া একই নির্দিষ্ট বিন্দুতে সীমাবদ্ধ থাকবে। এটি একটি সুস্পষ্ট বিন্দু-থেকে-বিন্দু সংকেত প্রক্রিয়াকরণ পদ্ধতি। আর যদি পুরো চোখের পর্দা আলো দ্বারা উদ্দীপ্ত হয়, তাহলে প্রতিক্রিয়া উভয় পার্শ্বীয় জেনিকুলেট দেহ এবং সরল খাঁজযুক্ত ধূসর পদার্থে ঘটবে। এই মস্তিষ্ক অঞ্চলের একটি মানচিত্র তৈরি করা সম্ভব, যেটি চোখের পর্দার ক্ষেত্র বা সাধারণত দৃষ্টিক্ষেত্রের সাথে সামঞ্জস্যপূর্ণ।

এই পথের পরবর্তী ধাপগুলি এই গ্রন্থের আলোচনার পরিসরের বাইরে। তবে নিশ্চিত থাকা যায়, আরও অনেক স্তর এবং কেন্দ্র বিদ্যমান, যেগুলি নির্দিষ্ট নির্দিষ্ট কাজের উপর মনোযোগ কেন্দ্রীভূত করে, যেমন: রং, দিকনির্দেশনা, স্থানের ঘনত্ব, আবেগ ইত্যাদি।

ভিজ্যুয়াল সিস্টেমে তথ্য প্রক্রিয়াকরণ

সম্পাদনা

দৃষ্টিশক্তি ব্যবস্থায় সংকেত প্রক্রিয়াকরণের কিছু গুরুত্বপূর্ণ ধারণা সম্পর্কে সুস্পষ্ট ধারণা পাওয়ার পর, সংবেদনশীল তথ্যের অনুধাবন বা উপলব্ধি হচ্ছে চূড়ান্ত গুরুত্বপূর্ণ ধাপ। দৃষ্টিগ্রহণ হলো এমন একটি প্রক্রিয়া, যার মাধ্যমে চোখে আসা তথ্যকে বাইরের পরিবেশ সম্পর্কে বোঝাপড়ায় রূপান্তর করা হয়। এটি আমাদের চারপাশের জগত সম্পর্কে সচেতন করে এবং সেটিকে ভালোভাবে বুঝতে সাহায্য করে। দৃষ্টিগ্রহণের ভিত্তিতে আমরা নানারকম নিদর্শন শিখি, যা আমরা জীবনের বিভিন্ন পর্যায়ে প্রয়োগ করি এবং এর ওপর ভিত্তি করেই সিদ্ধান্ত গ্রহণ করি। অন্যভাবে বললে, আমাদের টিকে থাকার জন্য উপলব্ধি অপরিহার্য। দৃষ্টিগ্রহণ বিষয়ক ক্ষেত্রকে বিভিন্ন উপক্ষেত্রে ভাগ করা হয়েছে, কারণ এই প্রক্রিয়া অত্যন্ত জটিল এবং যা উপলব্ধির জন্য বিভিন্ন বিশেষায়িত ব্যবস্থার প্রয়োজন হয়। এই উপক্ষেত্রগুলির মধ্যে রয়েছে: রং উপলব্ধি, গতি উপলব্ধি, গভীরতা উপলব্ধি এবং মুখ চেনার ক্ষমতা ইত্যাদি।

প্রাইমেট ভিজ্যুয়াল কর্টেক্সে গভীর শ্রেণিবিন্যাস

সম্পাদনা
 
দৃষ্টিশক্তি ব্যবস্থায় গভীর স্তরভিত্তিক বিন্যাস

যদিও ইলেকট্রনিক ব্যবস্থাগুলোর গণনাশক্তি দিনদিন বৃদ্ধি পাচ্ছে তবুও অনেক কাজেই প্রাণী ও মানুষ এখনো যন্ত্রের তুলনায় অনেক দক্ষ তার মধ্যে একটি হলো তথ্যের উপলব্ধি এবং প্রেক্ষাপট বোঝা। প্রচলিত কম্পিউটার হোক সেটা মোবাইলে কিংবা একটি ঘরজুড়ে বিস্তৃত সুপার কম্পিউটার তা মূলত সংখ্যার হিসাব-নিকাশ করে। এটি মুহূর্তের মধ্যেই বিপুল পরিমাণ গণনা করতে পারে। কিন্তু এটি যে তথ্য নিয়ে কাজ করে তার সারাংশ বা বিমূর্ত ধারণা তৈরি করতে পারে না। যদি আপনি কম্পিউটারে একটি ক্যামেরা যুক্ত করেন তাহলে সে যা “দেখে” তা শুধু একটি পিক্সেল গ্রিড অর্থাৎ সংখ্যার একটি দ্বিমাত্রিক বিন্যাস। কিন্তু একজন মানুষ মুহূর্তেই সেই দৃশ্যের গঠন, বস্তুর উপস্থিতি এমনকি তার প্রেক্ষাপটও বুঝে ফেলতে পারে। এই দক্ষতা আসে মস্তিষ্কের বিশেষায়িত জীববিদ্যাগত যন্ত্রাংশ আমাদের দৃষ্টিশক্তি ব্যবস্থার মাধ্যমে। এটি আমরা যা দেখি তা একধরনের স্তরভিত্তিক উপায়ে প্রক্রিয়াকরণ করে সহজ বৈশিষ্ট্য থেকে শুরু করে জটিল বৈশিষ্ট্যে পৌঁছে বস্তু শ্রেণিবিন্যাস পর্যন্ত নিয়ে যায়। এজন্যই একে বলা হয় গভীর স্তরযুক্ত প্রক্রিয়া। প্রাইমেটদের এই গভীর স্তরভিত্তিক দৃষ্টিশক্তি ব্যবস্থা থেকেই অনুপ্রাণিত হয়ে বিজ্ঞানীরা বহুস্তরবিশিষ্ট কৃত্রিম স্নায়ুবিন্যাস তৈরি করেছেন। যেখানে প্রতিটি স্তর আগের স্তরের তুলনায় আরও উচ্চতর বিমূর্ত ধারণা তৈরি করে।

মানব মস্তিষ্কের নতুন আবরণ অংশের প্রায় অর্ধেকই দৃষ্টির জন্য নিবেদিত। এই তথ্য প্রক্রিয়াকরণ অন্তত ১০টি কার্যকর স্তরে সম্পন্ন হয়। প্রাথমিক অঞ্চলের স্নায়ুকোষ ছোট ছোট অঞ্চলে সহজ চিত্র বৈশিষ্ট্য শনাক্ত করে। যখন তথ্য আরও উচ্চতর স্তরে যায় তখন স্নায়ুকোষ আরও জটিল বৈশিষ্ট্যে প্রতিক্রিয়া দেখায়। উচ্চতর স্তরে তথ্য প্রক্রিয়াকরণের ফলে প্রদর্শন আরও অপরিবর্তনীয় হয়ে ওঠে অর্থাৎ বৈশিষ্ট্যের আকার, ঘূর্ণন বা অবস্থান পরিবর্তন হলেও তা প্রভাব ফেলে না। এছাড়া, উচ্চতর স্তরের স্নায়ুকোষের গ্রহণক্ষেত্রের পরিধি আরও বড় হয়, যা বোঝায় যে তারা আরও বিস্তৃত বৈশিষ্ট্যে সাড়া দেয়। এই স্তরভিত্তিক গঠন একটি দক্ষ গণনার ব্যবস্থা তৈরি করে। উচ্চতর স্তরের এলাকাগুলি নিচের স্তরের প্রক্রিয়াজাত তথ্যই ব্যবহার করে বিভিন্ন কাজে। প্রাথমিক স্তরের সাধারণ দৃশ্য বর্ণনা মস্তিষ্কের অন্যান্য অংশ ব্যবহার করে বস্তু চেনা, শ্রেণিবিন্যাস, ধরা, নিয়ন্ত্রণ, চলন পরিকল্পনা ইত্যাদি কাজ করে।

প্রান্তবর্তী কর্টেক্সের পূর্ব দৃষ্টি

সম্পাদনা

দৃষ্টিশক্তির তথ্য প্রক্রিয়াকরণ মস্তিষ্কের কর্টেক্সে পৌঁছানোর আগেই শুরু হয়। চোখের পর্দায় অবস্থিত আলোকসংবেদনশীল কোষগুলো আলো শনাক্ত করে এবং তা থেকে সংকেত তৈরি করে রেটিনার স্নায়ুকোষে পাঠায়। একটি আলোকসংবেদনশীল কোষের গ্রহণ ক্ষেত্র প্রায় একশ ভাগের এক ডিগ্রি একটি ডিগ্রির ক্ষেত্র বলতে বোঝায় হাত সামনের দিকে ছড়িয়ে ধরলে বৃদ্ধাঙ্গুলির সমান অংশ। একটি স্নায়ুকোষ কত সংখ্যক আলোকসংবেদনশীল কোষ থেকে সংকেত পাচ্ছে, তা নির্ভর করে অবস্থানের উপর চোখের পর্দার কেন্দ্রে মাত্র ৫টি কোষ থেকে সংকেত পায়, আর প্রান্তে একটি স্নায়ুকোষ হাজার হাজার কোষ থেকে সংকেত পেতে পারে। এর মানে, সর্বোচ্চ স্থানিক রেজোলিউশন চোখের পর্দার কেন্দ্রে, যাকে ফোভিয়া বলা হয়। এই বৈশিষ্ট্যের কারণে প্রাইমেটদের একটি দৃষ্টিনিয়ন্ত্রণ ব্যবস্থা রয়েছে, যা দেখার লক্ষ্যবস্তু ফোভিয়াতে পড়ে এমনভাবে দৃষ্টি পরিচালনা করে।

স্নায়ুকোষগুলো চিত্রের বিভিন্ন বৈশিষ্ট্য শনাক্ত করতে বিশেষায়িত যেমন উজ্জ্বলতা পার্থক্য, রঙের পার্থক্য, গতি এবং দিক। এই বৈশিষ্ট্যগুলোই পরবর্তী স্তরের প্রক্রিয়াকরণের জন্য মূল তথ্য। যদি কোনো দৃষ্টিগত উদ্দীপনা এমন হয় যা এই স্নায়ুকোষ শনাক্ত করতে পারে না, তাহলে তা মস্তিষ্কের কর্টেক্সেও উপলব্ধি করা সম্ভব নয়।

এই স্নায়ুকোষগুলো মস্তিষ্কের থ্যালামাসে অবস্থিত পার্শ্বীয় জেনিকুলেট নিউক্লিয়াসে সংকেত পাঠায়, যা আবার সেই সংকেত কর্টেক্সে প্রেরণ করে। পার্শ্বীয় জেনিকুলেট নিউক্লিয়াসে উল্লেখযোগ্য কোনো প্রক্রিয়াকরণ হয় না এখানে চোখের পর্দার স্নায়ুকোষ এবং নিউক্লিয়াসের স্নায়ুকোষের মধ্যে প্রায় এক-থেকে-এক সম্পর্ক রয়েছে। তবে, এখানে প্রাপ্ত সংকেতের মাত্র ৫% আসে চোখের পর্দা থেকে বাকিগুলো সব কর্টেক্স থেকে প্রতিফলনমূলক সংকেত হিসেবে আসে। যদিও দৃষ্টিশক্তি ব্যবস্থা সাধারণভাবে একমুখী প্রবাহ হিসেবে বিবেচিত, তথাপি প্রতিফলিত সংযোগ এবং পার্শ্ব সংযোগ কর্টেক্স জুড়ে সাধারণ বৈশিষ্ট্য। এই প্রতিফলনের সুনির্দিষ্ট ভূমিকা এখনো পুরোপুরি বোঝা যায়নি, তবে ধারণা করা হয় এটি মনোযোগ, প্রত্যাশা, কল্পনা এবং অপূর্ণ তথ্য পূরণ করার কাজে ব্যবহৃত হয়।

কর্টিকাল ভিশন

সম্পাদনা
 
দৃষ্টিশক্তি ব্যবস্থার প্রধান অঞ্চলসমূহ

ভিজ্যুয়াল কর্টেক্সকে তিনটি বৃহৎ অংশে ভাগ করা যেতে পারে অক্সিপিটাল অংশ যা LGN থেকে ইনপুট গ্রহণ করে এবং তারপর পৃষ্ঠীয় এবং ভেন্ট্রাল স্ট্রিমগুলিতে আউটপুট পাঠায়। অক্সিপিটাল অংশে V1-V4 এবং MT এলাকা অন্তর্ভুক্ত, যা দৃশ্যমান তথ্যের বিভিন্ন দিক প্রক্রিয়া করে এবং একটি সাধারণ দৃশ্য উপস্থাপন করে। ডরসাল পথ স্থান বিশ্লেষণ এবং কর্মপরিকল্পনার সঙ্গে যুক্ত। ভেন্ট্রাল পথ বস্তুর স্বীকৃতি ও শ্রেণীবিন্যাসের সঙ্গে জড়িত।

V1 হলো কর্টেক্সের প্রথম অঞ্চল যেখানে চাক্ষুষ তথ্য প্রক্রিয়াকরণ শুরু হয়। এটি প্রান্ত, গ্রেটিং, রেখার শেষাংশ, গতি, রঙ এবং বৈপরীত্যের প্রতি সংবেদনশীল। নিচ থেকে ওপরের দিকে ধাপে ধাপে সংকেত বিশ্লেষণের একটি সহজ উদাহরণ হলো কেন্দ্র-প্রান্ত গ্রাহক ক্ষেত্র বিশিষ্ট একাধিক গ্যাংলিয়ন কোষের ইনপুট একত্র করে একটি বার আকৃতির উপস্থাপন তৈরি করা। এই কাজটি করে V1-এর সাধারণ কোষসমূহ। প্রখ্যাত স্নায়ুবিজ্ঞানী হুবেল ও উইজেল প্রথম এটি বর্ণনা করেন। এই ধরনের সংকেত একত্রীকরণ বোঝায় যে সাধারণ কোষগুলো নির্দিষ্ট স্থানে অবস্থিত বারের প্রতি সংবেদনশীল এবং এদের গ্রাহক ক্ষেত্র অপেক্ষাকৃত ছোট। V1-এর জটিল কোষগুলো সাধারণ কোষ থেকে সংকেত গ্রহণ করে। এরা রেখার মতো সরল আকৃতির প্রতি সংবেদনশীল হলেও সেগুলোর নির্দিষ্ট অবস্থানের উপর নির্ভর করে না এবং এদের গ্রাহক ক্ষেত্র বড় হয়। এই ধাপে গাণিতিকভাবে বৃহৎ মান নির্বাচন প্রক্রিয়া হতে পারে, যেখানে বিভিন্ন উত্তেজনার মধ্যে বড়টির অনুরূপ প্রতিক্রিয়া তৈরি হয়। কিছু সাধারণ ও জটিল কোষ বারের শেষ প্রান্ত শনাক্ত করতে পারে। আবার কিছু V1 কোষ স্থানীয় গতির প্রতিও সংবেদনশীল।

V2 অঞ্চল আরও জটিল সীমারেখা উপস্থাপন করে। এতে টেক্সচার-নির্ভর সীমারেখা, বিভ্রমজনিত সীমারেখা এবং প্রান্তের মালিকানা সহ সীমারেখা অন্তর্ভুক্ত থাকে। V2 অঞ্চল V1-এ দৃশ্যমান সম্পূর্ণ বৈপরীত্য শনাক্তকরণের উপর ভিত্তি করে আরও উন্নত বৈপরীত্য শনাক্ত করে। এটি দুইটি স্থানের সম্পূর্ণ বৈপরীত্যের পার্থক্য শনাক্ত করে। V4 অঞ্চল V2 ও V3 অঞ্চল থেকে সংকেত পায়, যদিও V3-এ কী ধরনের প্রক্রিয়াকরণ ঘটে তা এখনও স্পষ্ট নয়। V4 অঞ্চলের স্নায়ুকোষগুলি বিভিন্ন বক্রতা বিশিষ্ট সীমারেখা এবং নির্দিষ্ট কোণে শীর্ষবিন্দুর প্রতি সংবেদনশীল। এই অঞ্চলে আলোকমাত্রা-অপরিবর্তনশীল রঙ শনাক্তের ব্যবস্থাও আছে। এর বিপরীতে, V1 অঞ্চলে স্নায়ুকোষ দুটি প্রধান বিপরীতমুখী রঙ (লাল-সবুজ ও হলুদ-নীল) বরাবর প্রতিক্রিয়া দেয়, প্রকৃত রঙের প্রতি নয়। V4 অঞ্চল ভেন্ট্রাল প্রবাহের মাধ্যমে ইনফেরিয়র টেম্পোরাল কর্টেক্সে (আইটি) সংকেত পাঠায়। গবেষণায় দেখা গেছে, এই অঞ্চল বস্তু শনাক্তকরণের জন্য অত্যাবশ্যক।

ইনফেরিয়র টেম্পোরাল কর্টেক্স: বস্তুর পার্থক্য নির্ধারণ

সম্পাদনা
 
TE অঞ্চলে উদ্দীপনার সরলীকরণ

ইনফেরিয়র টেম্পোরাল কর্টেক্স (আইটি) দুটি অঞ্চলে বিভক্ত TEO এবং TE। TEO অঞ্চল বিভিন্ন সীমারেখার আকৃতি ও আপেক্ষিক অবস্থান সংযুক্ত করে। সাধারণত এখানে সহজ বৈশিষ্ট্যের সমন্বয়ে গঠিত কোষ থাকে। TEO কোষের গ্রহণযোগ্য মাত্রা সাধারণত ৩ থেকে ৫ ডিগ্রি হয়ে থাকে। TE অঞ্চলে বৃহৎ গ্রাহক ক্ষেত্রবিশিষ্ট কোষ থাকে যা ১০ থেকে ২০ ডিগ্রি। এই কোষগুলো মুখাবয়ব, হাত ও জটিল বৈশিষ্ট্যের গঠনের প্রতি সংবেদনশীল। TE অঞ্চলের কোষগুলো সাধারণ বস্তুর চেয়ে জটিল কিন্তু খুব সহজ রৈখিক আকৃতি নয় এমন বৈশিষ্ট্যের প্রতি প্রতিক্রিয়া দেয়। তানাকা ও সহকর্মীদের পরিচালিত গবেষণায় দেখা যায় যে প্রথমে একটি বস্তুর প্রতি প্রতিক্রিয়া মাপা হয় এরপর ধাপে ধাপে বস্তুকে সরল করে ফেলা হয় যতক্ষণ না নির্দিষ্ট বৈশিষ্ট্য খুঁজে পাওয়া যায়। যেটিতে TE কোষগুলো সাড়া দেয়।

TE অঞ্চলের কোষগুলো ভেন্ট্রাল প্রবাহের নিচের স্তরের মাঝামাঝি জটিল বৈশিষ্ট্যগুলো একত্র করে বস্তু অংশের মডেল তৈরি করে। এই কোষগুলোকে একই সাথে দুটি বিপরীত চাহিদা পূরণ করতে হয় বাছাইক্ষমতা ও অপরিবর্তনীয়তা। এরা চোখে দেখা বৈশিষ্ট্য অনুযায়ী বিভিন্ন বস্তুকে আলাদা করে চিনতে সক্ষম। কিন্তু একই বস্তু ভিন্ন দৃষ্টিকোণ, দূরত্ব বা আলোতে দেখা গেলে তার ছবি ভিন্ন রকম হয়। এইসব পরিবর্তনের মধ্যেও একই বস্তুকে শনাক্ত করতে হলে এমন বৈশিষ্ট্য প্রয়োজন যা অবস্থান, আকার, আলো প্রভৃতির পরিবর্তন সত্ত্বেও অপরিবর্তিত থাকে। TE কোষগুলো অবস্থান ও আকারের পরিবর্তনে, আংশিক ঢাকা পড়লে, গভীরতার অবস্থান এবং আলোর দিক পরিবর্তনেও প্রতিক্রিয়া দেয়। তবে গভীরতায় ঘূর্ণনের ক্ষেত্রে প্রতিক্রিয়া দুর্বল হয়, যদি না বস্তুটি মানুষের মুখ হয়।

TE অঞ্চলে এখনো বস্তু শ্রেণী স্পষ্টভাবে দেখা যায় না। একটি কোষ একই শ্রেণীর কিছু বস্তুতে সাড়া দিতে পারে, আবার ভিন্ন শ্রেণীর কিছু বস্তুকেও চিনতে পারে। বস্তু শনাক্তকরণ ও শ্রেণীবিন্যাস সম্ভবত TE অঞ্চলের অনেক কোষের সম্মিলিত সংকেত এবং অন্যান্য মস্তিষ্ক অঞ্চলের প্রাসঙ্গিক তথ্যের উপর নির্ভর করে। সাম্প্রতিক গবেষণায় দেখা গেছে, পরিসংখ্যানভিত্তিক শ্রেণীবিন্যাস পদ্ধতি (যেমন সাপোর্ট ভেক্টর মেশিন) কয়েকটি TE কোষের প্রতিক্রিয়া বিশ্লেষণ করেও বস্তু শ্রেণী নির্ধারণ করতে পারে। অর্থাৎ, একটি TE কোষগোষ্ঠীর সম্মিলিত কার্যকলাপ বস্তু শ্রেণী নির্ভরযোগ্যভাবে জানাতে পারে। আশ্চর্যের বিষয় হলো, মধ্যবর্তী টেম্পোরাল লোব অঞ্চলে কিছু কোষ অত্যন্ত নির্দিষ্ট সংকেতে প্রতিক্রিয়া দেয়। যেমন বিভিন্ন ছবিতে পিসার টাওয়ার দেখলে, বা নির্দিষ্ট কোনো ব্যক্তির মুখ দেখলে প্রতিক্রিয়া দেয় এমন কোষও পাওয়া গেছে।

ভিজ্যুয়াল সিস্টেম শেখার পদ্ধতি

সম্পাদনা

ভিজ্যুয়াল সিস্টেম শেখার ফলে নিউরনের দৃষ্টিগত বৈশিষ্ট্য বাছাই করার ক্ষমতা পরিবর্তিত হতে পারে। উচ্চতর স্তরে এই পরিবর্তনের প্রভাব আরও বেশি হয়। তবে রেটিনায় শেখার বিষয়ে এখনো কোনো প্রমাণ পাওয়া যায়নি। V1 এর ওরিয়েন্টেশন ম্যাপগুলিও সম্ভবত জেনেটিকভাবে পূর্বনির্ধারিত। তবে ওরিয়েন্টেশন শনাক্ত করার অনুশীলন V1 নিউরনের ওরিয়েন্টেশন কোডিংয়ের উন্নতি ঘটায়। এটি টিউনিং কার্ভের ঢাল বৃদ্ধি করে। V4 এ অনুরূপ কিন্তু আরও শক্তিশালী প্রভাব দেখা যায়। TE এলাকায় সামান্য পরিমাণ ভিজ্যুয়াল সিস্টেমের প্রশিক্ষণেও একক কোষ স্তরে এবং fMRI তে ভিজ্যুয়াল সিস্টেমের ধারণায় উল্লেখযোগ্যভাবে শারীরবৃত্তীয় পরিবর্তন ঘটে। উদাহরণস্বরূপ দুটি বস্তুকে একে অপরের মধ্যে রূপান্তর করলে সেগুলোর মধ্যে উপলব্ধি করা সাদৃশ্য বৃদ্ধি পায়। সব মিলিয়ে বোঝা যায় যে পূর্ণবয়স্কদের ভিজ্যুয়াল কর্টেক্স অনেকটাই নমনীয়। কিছু নির্দিষ্ট ওষুধ প্রয়োগ করলে বা সমৃদ্ধ পরিবেশে বসবাস করলে এই নমনীয়তার মাত্রা আরও অনেক বেড়ে যেতে পারে।

ডিপ নিউরাল নেটওয়ার্ক

সম্পাদনা

প্রাইমেট ভিজ্যুয়াল সিস্টেমের গভীর শ্রেণিবিন্যাসের মতো ডিপ লার্নিং স্থাপত্যগুলি একাধিক স্তরের অ-রৈখিক রূপান্তর ব্যবহার করার মাধ্যমে ইনপুট ডেটার উচ্চ-স্তরের বিমূর্ততা মডেল করার চেষ্টা করে। হাবেল ও উইসেলের প্রস্তাবিত মডেল যেখানে তথ্য রেটিনা ও LGN থেকে শুরু হয়ে V1 এর সাধারণ ও জটিল কোষগুলোতে ধাপে ধাপে একত্রিত ও প্রেরিত হয়। যা অনুপ্রাণিত করেছিল প্রাথমিক ডিপ লার্নিং স্থাপত্যগুলোর একটি ফলে নিওকগনিট্রনের সৃষ্টি। এটি ছিল একটি বহুস্তর বিশিষ্ট কৃত্রিম নিউরাল নেটওয়ার্ক মডেল। এটি বিভিন্ন ধরণের প্যাটার্ন শনাক্তকরণ কাজে ব্যবহৃত হয় যেমন হাতে লেখা অক্ষর সনাক্তকরণ। তবে এই নেটওয়ার্ক প্রশিক্ষণ দিতে অনেক সময় লাগত (দিনের পর দিন)। ফলে ১৯৮০ এর দশকে এর উদ্ভাবনের পর ডিপ লার্নিং বিশেষ মনোযোগ পায়নি। পরবর্তীতে ২০০০ এর দশকের মাঝামাঝি পর্যাপ্ত ডিজিটাল ডেটা এবং দ্রুত প্রশিক্ষণ অ্যালগরিদম আবিষ্কারের মাধ্যমে এটি জনপ্রিয়তা পায়। ডিপ নিউরাল নেটওয়ার্কগুলো এমন সব কাজে অত্যন্ত দক্ষ প্রমাণিত হয়েছে, যেগুলো কিছুদিন আগেও শুধুমাত্র মানুষই করতে পারত। যেমন: ছবিতে নির্দিষ্ট ব্যক্তির মুখ চিনে ফেলা, মানুষের কথা কিছুটা বুঝতে পারা এবং বিদেশি ভাষার লেখা অনুবাদ করা। এছাড়াও শিল্প ও বিজ্ঞানের নানা ক্ষেত্রে এগুলো বেশ কার্যকর হয়েছে। যেমন সম্ভাব্য ওষুধ প্রার্থী খুঁজে বের করা, মস্তিষ্কের প্রকৃত নিউরাল নেটওয়ার্ক ম্যাপ করা এবং প্রোটিনের কার্যাবলি পূর্বাভাস দেওয়া। তবে মনে রাখতে হবে, ডিপ লার্নিং মূলত মস্তিষ্কের কাছ থেকে সামান্য অনুপ্রেরণা নিলেও এটি কম্পিউটার বিজ্ঞান ও মেশিন লার্নিংয়ের একটি বড় অর্জন। নিউরোসায়েন্সের অর্জন এটি নয়। এর সাধারণ মিল হলো, ডিপ নিউরাল নেটওয়ার্কগুলো ইউনিট নিয়ে গঠিত যা অ-রৈখিক উপায়ে ইনপুট তথ্য গ্রহণ করে (নিউরন) এবং একে অপরকে সংকেত পাঠায় (সিন্যাপ্স)। এছাড়াও এটি বিভিন্ন স্তরে ক্রমাগত বিমূর্ত রূপে ডেটাকে উপস্থাপন করে। তবে ডিপ লার্নিংয়ে ব্যবহৃত “নিউরন” এবং শেখার অ্যালগরিদমগুলো বাস্তব মস্তিষ্কে ঘটে চলা প্রক্রিয়া থেকে অনেকটাই ভিন্ন। তাই ডিপ লার্নিং উন্নততর কৃত্রিম বুদ্ধিমত্তার দিকে এগিয়ে গেলেও, মস্তিষ্ক সম্পর্কে এটি খুব সীমিত ধারণাই দিতে পারে।

 
একটি নিউরনের উদাহরণ এবং এর প্রধান উপাদানসমূহ।
 
নিউরাল নেটওয়ার্কের একটি মৌলিক ইউনিটের উদাহরণ। এখানে সক্রিয়করণ ফাংশন হিসেবে ব্যবহার করা হয়েছে Rectified Linear Unit (ReLU), তবে এর পাশাপাশি সিগময়েড বা হাইপারবোলিক ট্যানজেন্টও ব্যবহার করা যায়। থ্রেশহোল্ড পরিবর্তন করার মাধ্যমে বাইয়াস ইউনিটটির সক্রিয়করণ করা হয়। এটি নিউরনের অ্যাকশন পটেনশিয়ালের থ্রেশহোল্ডের মতো কাজ করে।
 
একটি ডিপ নিউরাল নেটওয়ার্কের উদাহরণ। প্রতিটি বর্গ একটি ইউনিটকে নির্দেশ করে, যেমনটি উপরের ছবিতে দেখানো হয়েছে।

তথ্যসূত্র

সম্পাদনা
ভিজ্যুয়াল লার্নিং এর গভীর স্তরবিন্যাস নিয়ে গবেষণাপত্রসমূহ
  • Kruger, N.; Janssen, P.; Kalkan, S.; Lappe, M.; Leonardis, A.; Piater, J.; Rodriguez-Sanchez, A. J.; Wiskott, L. (আগস্ট ২০১৩)। "Deep Hierarchies in the Primate Visual Cortex: What Can We Learn for Computer Vision?"। IEEE Transactions on Pattern Analysis and Machine Intelligence35 (8): 1847–1871। doi:10.1109/TPAMI.2012.272 
  • Poggio, Tomaso; Riesenhuber, Maximilian (১ নভেম্বর ১৯৯৯)। Nature Neuroscience2 (11): 1019–1025। doi:doi:10.1038/14819 |doi= এর মান পরীক্ষা করুন (সাহায্য)  |শিরোনাম= অনুপস্থিত বা খালি (সাহায্য)
উদ্দীপনা হ্রাস নিয়ে পরীক্ষা
  • Tanaka, Keiji (মার্চ ১৯৯৬)। "Inferotemporal Cortex and Object Vision"। Annual Review of Neuroscience19 (1): 109–139। doi:10.1146/annurev.ne.19.030196.000545 
ভিজ্যুয়াল লার্নিং শেখার প্রমাণ
  • Li, Nuo; DiCarlo, James J. (২৩ সেপ্টেম্বর ২০১০)। "Unsupervised Natural Visual Experience Rapidly Reshapes Size-Invariant Object Representation in Inferior Temporal Cortex"। Neuron67 (6): 1062–1075। doi:10.1016/j.neuron.2010.08.029 
  • Raiguel, S.; Vogels, R.; Mysore, S. G.; Orban, G. A. (১৪ জুন ২০০৬)। "Learning to See the Difference Specifically Alters the Most Informative V4 Neurons"। Journal of Neuroscience26 (24): 6589–6602। doi:10.1523/JNEUROSCI.0457-06.2006 
  • Schoups, A; Vogels, R; Qian, N; Orban, G (২ আগস্ট ২০০১)। "Practising orientation identification improves orientation coding in V1 neurons."। Nature412 (6846): 549–53। PMID 11484056 
ডিপ লার্নিং গবেষণার বর্তমান অবস্থা নিয়ে একটি সাম্প্রতিক ও সহজবোধ্য পর্যালোচনা
  • Jones, Nicola (৮ জানুয়ারি ২০১৪)। "Computer science: The learning machines"। Nature505 (7482): 146–148। doi:10.1038/505146a 

গতি উপলব্ধি

সম্পাদনা

গতি উপলব্ধি হলো চলমান বস্তুর গতি ও দিক বোঝার একটি প্রক্রিয়া। মানুষের ক্ষেত্রে V5 এলাকা এবং প্রাইমেটদের ক্ষেত্রে MT (মিডেল টেম্পোরাল) অঞ্চল কর্টেক্সে গতি উপলব্ধির করার জন্য দায়ী। V5 এলাকা এক্সট্রাস্ট্রিয়েট কর্টেক্সের অংশ যা ব্রেইনের অক্সিপিটাল অঞ্চলে প্রাইমারি ভিজ্যুয়াল কর্টেক্সের পাশে অবস্থিত। এই অঞ্চলের কাজ হলো ভিজ্যুয়াল উদ্দীপনার গতি ও দিক শনাক্ত করা এবং স্থানীয় গতির সংকেতগুলো একত্রিত করে সামগ্রিক গতি তৈরি করা। V1 বা প্রাইমারি ভিজ্যুয়াল কর্টেক্স ব্রেইনের উভয় হেমিস্ফিয়ারের অক্সিপিটাল লোবে অবস্থিত। এটি চাক্ষুষ তথ্যের কর্টিকাল প্রক্রিয়াকরণের প্রথম ধাপ সম্পাদন করে। এই এলাকায় চোখ দ্বারা দেখা পুরো ভিজ্যুয়াল ফিল্ডের একটি পূর্ণাঙ্গ মানচিত্র থাকে। V5 এবং V1 অঞ্চলের মধ্যে পার্থক্য হলো V5 স্থানীয় সংকেত বা কোনো বস্তুর পৃথক অংশের গতি একত্র করে সামগ্রিকভাবে পুরো বস্তুটির গতি অনুধাবন করতে পারে। অন্যদিকে V1 শুধুমাত্র নিজের রিসেপ্টিভ ফিল্ডের মধ্যে ঘটা স্থানীয় গতির প্রতি সাড়া দেয়। অনেক নিউরনের হিসাবগুলো V5 অঞ্চলে একত্রিত হয়।

গতি সংজ্ঞায়িত হয় রেটিনায় আলোর পরিবর্তনের মাধ্যমে, যা স্থান ও সময়ের ওপর নির্ভর করে। গতি সংকেত দুটি ভাগে ভাগ করা হয়: প্রথম শ্রেণির গতি এবং দ্বিতীয় শ্রেণির গতি। নিচের অনুচ্ছেদগুলোতে এগুলো সংক্ষেপে ব্যাখ্যা করা হয়েছে।

 
একটি "বিটা মুভমেন্ট" এর উদাহরণ।

প্রথম শ্রেণির গতি উপলব্ধি ঘটে যখন একাধিক চাক্ষুষ উদ্দীপনা সময়ের সাথে সাথে চালু ও বন্ধ হয় এবং ভিন্ন ভিন্ন গতির অনুভূতি তৈরি করে। একে "আপেক্ষিক গতি" বলা হয় এবং এটি টেলিভিশন ও সিনেমায় ব্যবহৃত হয়। এর একটি উদাহরণ হলো "বিটা মুভমেন্ট", যা একটি বিভ্রম। এতে স্থির চিত্রগুলো আসলে না নড়লেও মনে হয় যেন নড়ছে। কারণ, এগুলো এত দ্রুত পরিবর্তন হয় যে চোখ তা আলাদা করে বুঝতে পারে না। এই বিভ্রম ঘটে কারণ মানুষের অপটিক নার্ভ প্রতি সেকেন্ডে ১০ বার আলোর পরিবর্তনের প্রতি সাড়া দেয়। তাই এর চেয়েও দ্রুত পরিবর্তন হলে তা ক্রমাগত গতি হিসেবে অনুভূত হয়, আলাদা আলাদা ছবির মতো নয়।

দ্বিতীয় শ্রেণির গতি বোঝায় সেই গতি যা ঘটে যখন চলমান কোনো রেখা বা আকৃতি কনট্রাস্ট, টেক্সচার, ঝিকিমিকি বা অন্য কোনো গুণের মাধ্যমে চিহ্নিত হয়। তবে এতে আলোকমাত্রা বা গতিশক্তি বাড়ে না। প্রমাণ পাওয়া গেছে যে প্রথম ও দ্বিতীয় শ্রেণির গতি প্রক্রিয়াকরণ শুরুতে পৃথক পথ দিয়ে সম্পন্ন হয়। দ্বিতীয় শ্রেণির পদ্ধতির সময়গত রেজোলিউশন কম এবং এটি নিম্ন-ফ্রিকোয়েন্সির স্থানীয় সংকেতের প্রতিক্রিয়ায় সক্রিয় হয়। দ্বিতীয় শ্রেণির গতি অপেক্ষাকৃত দুর্বল গতি-পরবর্তী প্রভাব সৃষ্টি করে। প্রথম ও দ্বিতীয় শ্রেণির সংকেতগুলো V5 এলাকায় একত্রিত হয়।

এই অধ্যায়ে আমরা "গতি উপলব্ধি" এবং "গতি বিশ্লেষণ" সংক্রান্ত ধারণাগুলি বিশ্লেষণ করব এবং ব্যাখ্যা করব কেন এই দুই শব্দ পরস্পরের বিকল্প হিসেবে ব্যবহার করা ঠিক নয়। আমরা গতি কীভাবে অনুভূত হয় তা বিশ্লেষণ করব যেমন গতি সংবেদক এবং বৈশিষ্ট্য অনুসরণ পদ্ধতির মাধ্যমে। গতি শনাক্ত করার জন্য স্নায়বিক সংবেদকের কার্যপদ্ধতি ব্যাখ্যা করতে তিনটি প্রধান তাত্ত্বিক মডেল রয়েছে। এসব মডেলের যথার্থতা যাচাই করার জন্য বিভিন্ন পরীক্ষাও চালানো হয়েছে। কিন্তু দুর্ভাগ্যবশত, পরীক্ষাগুলোর ফলাফল চূড়ান্ত নয়। এর মানে, কোনো একটি মডেলও পুরোপুরি গতি সংবেদকের কার্যপদ্ধতি বোঝাতে সক্ষম নয়। তবে প্রতিটি মডেলই গতি সংবেদকের কিছু নির্দিষ্ট বৈশিষ্ট্য অনুকরণ করতে সক্ষম। এই সংবেদকের কিছু বৈশিষ্ট্য এখানে বর্ণনা করা হয়েছে। শেষে এই অধ্যায়ে কিছু "গতি বিভ্রম" দেখানো হয়েছে। এগুলো প্রমাণ করে যে কখনও কখনও আমাদের গতি উপলব্ধিকে বিভ্রান্ত করা যায় এমন কিছু স্থির বাহ্যিক উপাদান দিয়ে, যেগুলো আসল গতির মতো করে গতি সংবেদককে উদ্দীপিত করে।


গতি বিশ্লেষণ এবং গতি উপলব্ধি
সম্পাদনা

গতি বিশ্লেষণ এবং গতি উপলব্ধি এই দুটি শব্দ প্রায়ই একই অর্থে ব্যবহার করা হয় যদিও বাস্তবে তা এক নয়। এগুলো একে অপরের সঙ্গে সম্পর্কযুক্ত হলেও এক নয়।

গতি বিশ্লেষণ বলতে বোঝানো হয় সেই প্রক্রিয়াগুলোকে যার মাধ্যমে গতি সংকেত বিশ্লেষণ করা হয়। যেমন গতি উপলব্ধি সব সময় চোখের রেটিনায় চিত্রের সরণ থেকে আসা সংকেতের উপর নির্ভর করে না, তেমনি গতি বিশ্লেষণও সব সময় গতি উপলব্ধির ফল দেয় না। একটি উদাহরণ হতে পারে "ভেকশন"। এটি এমন একটি ঘটনা যেখানে কেউ অনুভব করে সে নিজে চলছে যদিও সে স্থির আছে, কিন্তু সামনে দেখা বস্তুটি চলমান। এই ভেকশন দেখায়, একটি বস্তুর গতি বিশ্লেষণ করা সম্ভব, যদিও তা গতি হিসেবে অনুভূত হয় না। এই সংজ্ঞা থেকে বোঝা যায়, গতি হল এক ধরনের মৌলিক চিত্র বৈশিষ্ট্য। এটি চোখের দৃষ্টিসীমার প্রতিটি বিন্দুতে বিশ্লেষণ করা হয়। এই বিশ্লেষণের ফলাফল থেকেই আমরা উপলব্ধিগত তথ্য আহরণ করি।

গতি উপলব্ধি বলতে বোঝানো হয় কোনো চিত্রে বস্তুর বা পৃষ্ঠের গতি সম্পর্কে উপলব্ধিগত জ্ঞান অর্জনের প্রক্রিয়াকে। এই গতি উপলব্ধি হয় দুইভাবে সূক্ষ্ম স্থানীয় সংবেদকের মাধ্যমে অথবা বৈশিষ্ট্য অনুসরণ পদ্ধতির মাধ্যমে। স্থানীয় গতি সংবেদক হল এমন কিছু বিশেষায়িত স্নায়ু কোষ, যেগুলো গতি শনাক্ত করতে সক্ষম। এগুলো রঙ শনাক্তকারী সংবেদকের মতোই একটি বিশেষ কাজ করে। আর বৈশিষ্ট্য অনুসরণ হল গতি উপলব্ধির একটি পরোক্ষ পদ্ধতি। এটি সময়ের সঙ্গে সঙ্গে কোনো বস্তুর রেটিনায় অবস্থান পরিবর্তনের ওপর ভিত্তি করে গতি নির্ণয় করে। এটিকে তৃতীয় স্তরের গতি বিশ্লেষণও বলা হয়। এই পদ্ধতিতে কোনো নির্দিষ্ট বস্তুর প্রতি দৃষ্টি নিবদ্ধ রেখে দেখা হয়, তার অবস্থান সময়ের সঙ্গে কীভাবে পরিবর্তিত হয়েছে।


গতি সংবেদক
সম্পাদনা

চোখে গতি শনাক্তকরণ হল দৃষ্টিজ সংবেদনের প্রথম ধাপ। এটি ঘটে কিছু বিশেষায়িত স্নায়বিক প্রক্রিয়ার মাধ্যমে যেগুলো সময়ের সঙ্গে সঙ্গে চিত্রের উজ্জ্বলতার স্থানীয় পরিবর্তনের প্রতি সাড়া দেয়। এই গতি অন্যান্য চিত্র বৈশিষ্ট্য থেকে আলাদা ভাবে অনুভূত হয় এবং চিত্রের প্রতিটি স্থানে এটি শনাক্ত করা যায়। গবেষণায় প্রমাণ হয়েছে, গতি সংবেদক সত্যিই বিদ্যমান এবং তারা স্থানীয়ভাবে চিত্রের প্রতিটি বিন্দুতে কাজ করে। এই গতি সংবেদক রেটিনায় অবস্থিত কিছু নির্দিষ্ট স্নায়ু কোষ, যারা এমন দুটি ক্ষণস্থায়ী এবং খুব ছোট আলোর ঝলক থেকে গতি শনাক্ত করতে পারে, যেগুলোর মধ্যবর্তী দূরত্ব এত কম যে, বৈশিষ্ট্য অনুসরণ পদ্ধতিতে তা ধরা পড়ে না। এই সংবেদকের কাজ ব্যাখ্যা করতে তিনটি মূল মডেল রয়েছে। এই তিনটি মডেল একে অপরের থেকে স্বতন্ত্র। প্রতিটি মডেলই গতি উপলব্ধির নির্দিষ্ট কিছু বৈশিষ্ট্য ব্যাখ্যা করতে চায়। যদিও এখনো কোনো মডেলের পক্ষে যথেষ্ট প্রমাণ নেই যে, এটি মানব চোখের গতি সংবেদকের প্রকৃত কাজের প্রতিফলন ঘটায়, তবে তারা প্রত্যেকেই সংবেদকের কিছু নির্দিষ্ট কার্যক্ষমতা সঠিকভাবে ব্যাখ্যা করতে পারে।


 
গতি শনাক্ত করার দুটি ভিন্ন প্রক্রিয়া। বামে) "রাইকার্ট ডিটেক্টর" তৈরি হয় দুটি প্রতিফলিত উপ-একক দিয়ে। প্রতিটি উপ-এককে দুটি পাশপাশি বিন্দুর উজ্জ্বলতা মান পরিমাপ করে, যেগুলোর একটি নিম্ন-পাস ফিল্টার দ্বারা সাময়িকভাবে বিলম্বিত হয়। এই মানদ্বয় গুণ করার পর ফলাফল থেকে একটির মান আরেকটি থেকে বিয়োগ করা হয়। ডানে) গ্র্যাডিয়েন্ট ডিটেক্টরে একটি ফোটোরিসেপ্টরের মাধ্যমে পরিমাপ করা সাময়িক উজ্জ্বলতা পরিবর্তনকে (δI/δt) বিভাজিত করা হয় স্থানিক উজ্জ্বলতা পরিবর্তন (δI/δx) দ্বারা। স্থানিক গ্র্যাডিয়েন্টকে প্রায় অনুমান করা হয় দুটি কাছাকাছি বিন্দুর উজ্জ্বলতার পার্থক্য হিসেবে।

রাইকার্ট ডিটেক্টর

রাইকার্ট ডিটেক্টর ব্যবহার করা হয় কীভাবে গতি সংবেদক "প্রথম স্তরের গতি সংকেত" শনাক্ত করে, তা বোঝাতে। যখন কোনো বস্তু দৃষ্টিক্ষেত্রে বিন্দু A থেকে বিন্দু B তে যায়, তখন দুটি সংকেত তৈরি হয় একটি গতি শুরু হওয়ার আগে এবং আরেকটি গতি শেষ হওয়ার পর। এই মডেলটি এই গতি উপলব্ধি করে, যখন রেটিনার এক বিন্দুতে উজ্জ্বলতার পরিবর্তন হয় এবং অল্প সময় পর কাছাকাছি আরেকটি বিন্দুতে একই রকম পরিবর্তন ঘটে। রাইকার্ট ডিটেক্টর কাজ করে "সম্পর্ক বিশ্লেষণ" বা সহসম্পর্কের নীতির উপর ভিত্তি করে। এটি দুটি প্রতিবেশী বিন্দুর উজ্জ্বলতা সংকেতের স্থানিক ও সাময়িক সহসম্পর্ক ব্যবহার করে গতি শনাক্ত করে। এই মডেলে দুটি প্রতিবেশী ডিটেক্টর থাকে। একটি সংকেতের সঙ্গে অন্য একটি সংকেত (যেটি সময়ে বিলম্বিত) গুণ করা হয়। তারপর এই একই প্রক্রিয়া বিপরীত গতিতে পুনরায় করা হয় (এইবার বিলম্বিত সংকেতটি প্রথমে আসে)। তারপর, এই দুই গুণফলের পার্থক্য নেওয়া হয়। এই পার্থক্য থেকে গতি এবং গতি-গতির দিক নির্ধারণ করা যায়। এই ডিটেক্টরের প্রতিক্রিয়া নির্ভর করে উদ্দীপকের পর্যায়, বৈপরীত্য এবং গতির উপর। বিভিন্ন গতিতে সাড়া দেওয়া বহু ডিটেক্টর প্রয়োজন, যেন আসল গতির পরিমাপ সঠিকভাবে করা যায়। এই ধরনের ডিটেক্টরের জন্য সবচেয়ে শক্ত প্রমাণ পাওয়া গেছে, যখন গবেষণায় দেখা গেছে খুবই অল্প দৃশ্যমান লক্ষ্যবস্তুর দিক নির্ধারণে মানুষের সক্ষমতা।


স্থান-কাল গ্রেডিয়েন্ট

 

গতিসংবেদকের এই মডেলটি মূলত কম্পিউটার ভিশনের ক্ষেত্রে উদ্ভাবিত হয়েছিল। এটি এমন একটি নীতির উপর ভিত্তি করে তৈরি, যেখানে চিত্রের উজ্জ্বলতার কালগত পরিবর্তনের হার এবং স্থানিক পরিবর্তনের হারের অনুপাত গতির বেগ নির্ধারণ করে। তবে, যেসব জায়গায় উজ্জ্বলতা সর্বোচ্চ বা সর্বনিম্ন, সেখানে স্থানিক ডেরিভেটিভ শূন্য হওয়ায় এই মডেলটি সঠিক গতি নির্ধারণ করতে পারে না। এই সমস্যার সমাধানে স্থান ও সময়ের প্রেক্ষিতে প্রথম এবং উচ্চতর স্তরের ডেরিভেটিভ বিশ্লেষণ করা যায়। স্থান-কাল গ্রেডিয়েন্ট হলো এমন একটি কার্যকর মডেল যা চিত্রের প্রতিটি বিন্দুতে গতির বেগ নির্ধারণ করতে পারে।

মোশন সেন্সরগুলির ওরিয়েন্টেশন নির্বাচনী
সম্পাদনা

গতিসংবেদকদের একটি গুরুত্বপূর্ণ বৈশিষ্ট্য হলো অভিমুখ-নির্বাচকতা। এটি গতির বিশ্লেষণকে একমাত্রিক মাত্রায় সীমাবদ্ধ করে। কোনো গতিসংবেদক কেবলমাত্র তার পছন্দসই অভিমুখের লম্ব কোনো অক্ষে চলাচল শনাক্ত করতে পারে। কোনো বস্তুর গঠনে যদি একটি নির্দিষ্ট অভিমুখ থাকে, তাহলে সেই বস্তুটিকে কেবল তার অভিমুখের লম্ব কোনো দিকেই চলতে দেখা যাবে। একমাত্রিক গতিসংকেত দুইমাত্রিক বস্তুর গতি সম্পর্কে অস্পষ্ট বা বিভ্রান্তিকর তথ্য দেয়। তাই একটি ২-ডি বস্তুর সঠিক গতি নির্ধারণ করতে হলে অতিরিক্ত একটি বিশ্লেষণ পর্যায় প্রয়োজন হয়। বিভিন্ন অভিমুখে সাড়া দেওয়া সংবেদকগুলো থেকে প্রাপ্ত একমাত্রিক সংকেতগুলো একত্রিত করে একটি পরিষ্কার দুইমাত্রিক গতিসংকেত তৈরি করা হয়। এই দুইমাত্রিক বিশ্লেষণের জন্য স্থানীয়ভাবে বিস্তৃত এবং সংকীর্ণ অভিমুখ সংবেদনশীল সংবেদক উভয়ের সংকেত দরকার হয়।

ফিচার ট্র্যাকিং
সম্পাদনা

গতিবোধের আরেকটি উপায় হলো ফিচার ট্র্যাকিং। এখানে দেখা হয় কোনো বস্তুর নির্দিষ্ট বৈশিষ্ট্যগুলো তাদের অবস্থান পরিবর্তন করেছে কিনা। এই অবস্থান পরিবর্তনের ভিত্তিতে গতির ধারণা তৈরি হয়। যদি কোনো বস্তু খুব দ্রুত গতিতে সরে যায়, তাহলে ফিচার ট্র্যাকার কাজ করতে ব্যর্থ হয়। তবে ফিচার ট্র্যাকারদের একটা সুবিধা হলো, তারা এমন গতিও শনাক্ত করতে পারে যেখানে চলাচলের মাঝে ফাঁকা বা বিরতি থাকে। তারা চলাচল এবং ফাঁকা বিরতিকে আলাদা করতে পারে। অপরদিকে, গতিসংবেদক এগুলোকে একটানা চলাচল হিসেবে দেখে। ফিচার ট্র্যাকার কাজ করে শনাক্ত বৈশিষ্ট্যগুলোর অবস্থানের উপর। তাই তারা একটি নির্দিষ্ট দূরত্বের ভেতরে বৈশিষ্ট্য আলাদা করতে পারে। ফিচার ট্র্যাকারদের দ্বারা গতি-পরবর্তী প্রভাব দেখা যায় না। এই ভুল ধারণাটি তখন হয় যখন একটি চলমান বস্তু পর্যবেক্ষণের পর একটি স্থির বস্তুকে বিপরীত দিকে চলতে দেখা যায়।

এই পদ্ধতি একযোগে দৃষ্টির বিভিন্ন অংশে একাধিক গতির তথ্য বিশ্লেষণ করতে পারে না। কিন্তু গতিসংবেদকরা একসঙ্গে সম্পূর্ণ চাক্ষুষ ক্ষেত্রজুড়ে সমান্তরালভাবে কাজ করে বলে তাদের জন্য এটা কোনো সমস্যা নয়। এই তথ্য ব্যবহার করে কিছু পরীক্ষায় আকর্ষণীয় সিদ্ধান্তে উপনীত হওয়া গেছে। দেখা গেছে, অল্প সময়ের উদ্দীপনা ব্যবহার করে করা পরীক্ষায় উচ্চ কনট্রাস্টের রঙ বা কনট্রাস্ট প্যাটার্নগুলো ফিচার ট্র্যাকার দ্বারা নয় বরং গতিসংবেদকদের মাধ্যমে বোঝা যায়। ফাঁকা বিরতির পরীক্ষায় দেখা গেছে, ফিচার ট্র্যাকিং তখনও ঘটে যখন দৃশ্যে বিরতি থাকে। উচ্চ কনট্রাস্টে গতিসংবেদকরা রঙিন উদ্দীপনা ও কনট্রাস্ট প্যাটার্নের গতি বোঝে। কিন্তু নিম্ন কনট্রাস্টে ফিচার ট্র্যাকাররাই রঙিন প্যাটার্ন ও কনট্রাস্ট এনভেলপের গতি বিশ্লেষণ করে। আবার উচ্চ কনট্রাস্টে কনট্রাস্ট এনভেলপ বিশ্লেষণ করে শুধুমাত্র গতিসংবেদকরা।

যেসব পরীক্ষায় মানুষকে একাধিক গতি শনাক্ত করতে বলা হয়েছিল, সেগুলোতে দেখা গেছে, ফিচার ট্র্যাকিং হলো একটি সচেতনভাবে নিয়ন্ত্রিত প্রক্রিয়া। এটি সম্ভবত একমাত্র উপায় যার মাধ্যমে আমরা কম কনট্রাস্টের প্রদর্শনে কনট্রাস্ট এনভেলপের গতি বুঝতে পারি। এই ফলাফলগুলো ইঙ্গিত দেয় যে রঙিন প্যাটার্ন ও কনট্রাস্ট এনভেলপের গতি বোঝার জন্য ফিচার ট্র্যাকিং গুরুত্বপূর্ণ, বিশেষত যখন রঙ বা কনট্রাস্ট কম থাকে। এই পরীক্ষার প্রধান উপসংহার হলো, ফিচার ট্র্যাকিং-ই সম্ভবত কনট্রাস্ট এনভেলপ এবং রঙিন প্যাটার্নের গতি উপলব্ধির প্রধান মাধ্যম।

গতির বিভ্রম
সম্পাদনা

গতিশনাক্তকরণ যেভাবে কাজ করে, তার ফলে অনেক স্থির ছবি আমাদের চোখে চলমান বলে মনে হয়। এই ধরণের ছবি আমাদের চাক্ষুষ ব্যবস্থার সিদ্ধান্ত গ্রহণ প্রক্রিয়া সম্পর্কে ধারণা দেয়, এবং এগুলোকে বলা হয় দৃষ্টিভ্রম বা ভিজ্যুয়াল ইল্যুশন।

প্রথম শ্রেণির গতিসংকেত সংশ্লিষ্ট একটি বিখ্যাত ভ্রান্তি হলো ফাই ফেনোমেনন। এটি একটি অপটিক্যাল ইল্যুশন যা আমাদের মনে করায় যে আমরা একটানা গতি দেখছি, যদিও আসলে একাধিক স্থির ছবি একে একে প্রদর্শিত হচ্ছে। এই ইল্যুশনের কারণেই আমরা সিনেমাকে একটানা চলমান দৃশ্য হিসেবে দেখতে পারি। ফাই ফেনোমেননে ছবিগুলো দ্রুত গতিতে পাল্টানো হয়, ফলে তা একটানা গতি হিসেবে দেখা যায়।

তবে ফাই ফেনোমেনন এবং বিটা মুভমেন্ট আলাদা জিনিস। ফাই ফেনোমেনন হয় উজ্জ্বল আলোর ধারাবাহিক প্রক্ষেপণের কারণে, আর বিটা মুভমেন্ট হয় স্থির আলোর মাধ্যমে তৈরি বিভ্রম। যখন গতিবোধ, বিশ্লেষণ এবং সংকেতের ব্যাখ্যা বিভ্রান্তিকর হয়, তখনই এই ধরনের গতির ভ্রান্তি দেখা যায়। এই বিভ্রমগুলোকে তিনটি শ্রেণিতে ভাগ করা যায় গতিসংবেদনের সঙ্গে সম্পর্কিত বিভ্রম, দুইমাত্রিক সংহতকরণ সংশ্লিষ্ট বিভ্রম এবং তিনমাত্রিক ব্যাখ্যার বিভ্রম।

গতিসংবেদনের সঙ্গে সম্পর্কিত সবচেয়ে পরিচিত বিভ্রম হলো চার-স্ট্রোক গতি, এবং দ্বিতীয় ক্রম গতি সংকেত সংশ্লিষ্ট বিভ্রম। দুইমাত্রিক সংহতকরণ সংশ্লিষ্ট বিভ্রমের মধ্যে আছে মোশন ক্যাপচার, প্লেড মোশন এবং সরাসরি বিকর্ষণ। তিনমাত্রিক ব্যাখ্যাজনিত বিভ্রমের মধ্যে আছে রূপান্তরমূলক গতি, গতিশীল গভীরতা, ছায়া গতি, জৈবিক গতি, স্টেরিওকাইনেটিক গতি, অন্তর্নিহিত চিত্র গতি এবং ২ স্ট্রোক মোশন। এছাড়াও আরও অনেক ধরনের গতির বিভ্রম রয়েছে। প্রতিটি বিভ্রম মানুষের গতিশনাক্তকরণ, বিশ্লেষণ এবং উপলব্ধির প্রক্রিয়া সম্পর্কে নতুন কিছু তথ্য দেয়। আরও জানতে এই লিংকে দেখুন: http://www.lifesci.sussex.ac.uk/home/George_Mather/Motion/

অমীমাংসিত সমস্যা
সম্পাদনা

যদিও এখনো আমরা গতি উপলব্ধির অনেক বিশদ দিক বুঝে উঠতে পারিনি, গতি কিভাবে অনুভব করা হয় এবং গতি বিভ্রম কীভাবে তৈরি হয় তা বোঝা, এই বিষয়ে বর্তমান অবস্থা সম্পর্কে ভালো ধারণা দেয়। গতি উপলব্ধি নিয়ে কিছু অমীমাংসিত সমস্যার মধ্যে একটি হলো ত্রিমাত্রিক চিত্রের গঠনের প্রক্রিয়া এবং অ্যাপারচার সমস্যা। রেটিনা থেকে আসা গ্লোবাল মোশন সিগনাল বিশ্লেষণ করে একটি দ্বিমাত্রিক গ্লোবাল মোশন সিগনালে রূপান্তরিত করা হয়। কিন্তু ত্রিমাত্রিক গ্লোবাল মোশন কীভাবে তৈরি হয় তা এখনো স্পষ্ট নয়।

অ্যাপারচার সমস্যা হয় কারণ আমাদের দৃষ্টিসংবেদী ব্যবস্থায় প্রতিটি রিসেপ্টিভ ফিল্ড চাক্ষুষ বিশ্বের একটি ছোট অংশ কভার করে। এতে করে গতি উপলব্ধিতে বিভ্রান্তি দেখা দেয়। স্থানীয়ভাবে একটি চলমান কনট্যুর দেখলে, তা বিভিন্ন গতির সম্ভাবনার সঙ্গে মানানসই হতে পারে। এই বিভ্রান্তির উৎস জ্যামিতিক — কনট্যুর বরাবর যে গতি, সেটি শনাক্ত করা যায় না, কারণ এই দিকের পরিবর্তন অ্যাপারচারের মধ্য দিয়ে দেখা ছবিকে প্রভাবিত করে না। কেবল কনট্যুরের সাথে লম্বালম্বি গতিই পরিমাপযোগ্য। তাই গতি বাস্তবিকভাবে কোনো একটি নির্দিষ্ট গতি না হয়ে, বেগ স্পেসের একটি রেখা বরাবর অনেক গতির যেকোনো একটি হতে পারে।এই অ্যাপারচার সমস্যা কেবল সোজা রেখার ক্ষেত্রেই নয়, বরং মসৃণভাবে বাঁকানো রেখাতেও দেখা যায়। কারণ স্থানীয়ভাবে সেগুলোও প্রায় সোজা হিসেবেই প্রতিভাত হয়। যদিও এই সমস্যার সমাধানের সুনির্দিষ্ট প্রক্রিয়া এখনো জানা যায়নি, তবে কিছু সম্ভাব্য ব্যাখ্যা প্রস্তাব করা হয়েছে। যেমন, স্থানজুড়ে বা একই বস্তুর বিভিন্ন কনট্যুর থেকে তথ্য একত্র করে এই সমস্যার সমাধান হতে পারে।


উপসংহার
সম্পাদনা

এই অধ্যায়ে আমরা গতি উপলব্ধি এবং কীভাবে আমাদের দৃষ্টিসংবেদী ব্যবস্থা গতি শনাক্ত করে, তা আলোচনা করেছি। গতি বিভ্রম দেখিয়েছে, কীভাবে মোশন সিগনাল বিভ্রান্তিকর হতে পারে, এবং ফলস্বরূপ আমাদের গতি সম্পর্কে ভুল ধারণা তৈরি হতে পারে।

গতি উপলব্ধি এবং গতি বিশ্লেষণ এক নয় এটা মনে রাখা গুরুত্বপূর্ণ। মোশন সেন্সর এবং ফিচার ট্র্যাকার একে অপরের পরিপূরক হিসেবে কাজ করে, যাতে আমাদের দৃষ্টিসংবেদী ব্যবস্থা গতি শনাক্ত করতে পারে।গতি উপলব্ধি একটি জটিল প্রক্রিয়া, এবং এটি এখনো গবেষণার খোলা ক্ষেত্র। এই অধ্যায়ে মোশন সেন্সরের কার্যপ্রণালির মডেল এবং ফিচার ট্র্যাকার সম্পর্কে কিছু অনুমান আলোচনা করা হয়েছে। তবে এই ব্যবস্থাগুলোর প্রকৃত গঠন সম্পর্কে আরও জানার জন্য আরও পরীক্ষা-নিরীক্ষার প্রয়োজন। এতে করে আমরা এমন মডেল তৈরি করতে পারব, যেগুলো বাস্তব চাক্ষুষ প্রক্রিয়ার আরও ঘনিষ্ঠ অনুকরণ হবে।

এই অধ্যায়ে বর্ণিত গতি বিশ্লেষণ এবং গতি উপলব্ধির বিভিন্ন প্রক্রিয়া এবং সেগুলোর বর্ণনা দিতে কৃত্রিমভাবে তৈরি মডেলগুলোর জটিলতা দেখায়, আমাদের কর্টেক্স বাইরের পরিবেশ থেকে আসা সিগনাল কীভাবে বিশ্লেষণ করে, সেটি অত্যন্ত জটিল ও বিস্ময়কর। হাজার হাজার বিশেষায়িত নিউরন স্থানীয় সিগনালের টুকরোগুলো একত্র করে আমাদের মস্তিষ্কে চলমান বস্তুর একটি পূর্ণ চিত্র গঠন করে। এত জটিল প্রক্রিয়া এবং উপাদান একসাথে কাজ করে আমাদের চলাচল উপলব্ধি করায় এবং আমরা মানুষ তবুও সহজেই তা করতে পারি — এটি নিঃসন্দেহে বিস্ময়কর একটি ব্যাপার।