মূল পৃষ্ঠা > 

সংক্ষিপ্ত প্রতিবেদন

সংক্ষিপ্ত প্রতিবেদন

এই প্রতিবেদন কেন? আমরা কারা?
ডাউনলোড
এই প্রতিবেদন কীভাবে পড়তে হবে?
ডাউনলোড
ইন্টারনেট ঠিক কতটা বহুভাষিক?
ডাউনলোড
হুভাষিক ইন্টারনেটের ব্যাপারে আমরা কী জানলাম?
ডাউনলোড
কীভাবে আমরা আরো ভালো করতে পারি?: বহুভাষিক ইন্টারনেটের জন্য প্রেক্ষিত এবং কাজ
ডাউনলোড
পরিশেষে, আপনি কী করতে পারেন?
ডাউনলোড
কৃতজ্ঞতা
ডাউনলোড
সংজ্ঞা
ডাউনলোড

এই প্রতিবেদন কেন? আমরা কারা?

অভিধান ও ব্যাকরণ অনুযায়ী, ভাষা প্রধানতঃ মানুষের নিজেদের মধ্যে বিভিন্ন তথ্য প্রকাশ করার একটি কাঠামোগত পদ্ধতি। কিন্তু ভাষার তাৎপর্য এর চেয়ে আরও অনেক বেশি। ভাষা -আমাদের পরস্পরকে দেওয়া সেই প্রাথমিক ঐতিহ্য, যা আমরা আমাদের পূর্বজদের থেকে উত্তরাধিকারসূত্রে পাই, এবং ভাগ্য অনুকূল থাকলে দিয়ে যাই অনুজদের। আমরা যখন ভাবি, বলি, শুনি বা কল্পনা করি… তখন ভাষা ব্যবহার করি -নিজেদের জন্য এবং পরস্পরের জন্যও। এই পৃথিবীতে আমরা কারা, আমরা কেমন -তার মর্মে আছে এই ভাষা। এর মাধ্যমে আমরা গল্প বলি, পাশাপাশি, নিজের এবং একে অপরের বিষয়ে কী জানি -তা সকলের সঙ্গে ভাগ করে নেওয়াও এই ভাষারই সাহায্যে। আপনি কোন ভাষায় কথা বলেন? সেই ভাষাতেই কি স্বপ্ন দেখেন? কাজের জায়গায় যে ভাষায় কথা বলেন, মনে মনে কি সেই ভাষাতেই ভাবনাচিন্তা করেন, না অন্য ভাষায়? এমন কি কখনও হয়, যে ভাষার গান শুনতে আপনি পছন্দ করেন, সেই ভাষা আপনি বোঝেন না?

প্রতিটি ভাষাই আসলে আমাদের হওয়া, করা, এবং যোগাযোগ স্থাপনের পদ্ধতি বিশেষ। এবং তার চেয়েও গুরুত্বপূর্ণ হল, এটি কল্পনা করা ও জানারও মাধ্যম। আমাদের প্রতিটি ভাষা নিজেই এক একটি ‘জ্ঞানতন্ত্র’। আমাদের ভাষা এমন একটি মৌলিক উপায়, যার মধ্য দিয়ে জগৎকে আমরা বুঝি, সেইসঙ্গে অপরকেও বোঝাই। ভাষা হতে পারে মৌখিক (কথ্য ও সাঙ্কেতিক), লিখিত অথবা শিষ দেওয়া বা ঢাকের শব্দের মধ্য দিয়েও তা সম্প্রচারিত হতে পারে। -এই সবকটি রূপেই ভাষা জ্ঞানের প্রতিনিধি। অন্যভাবে বলতে গেলে, আমরা যা জানি, যা ভাবি, এবং বিশ্বাস করি, —তা প্রকাশ করার সবচেয়ে স্বতঃসিদ্ধ পথ হল ভাষা।

এবারে সেই ভাষাগুলির কথা ভাবুন যার মাধ্যমে আপনি বলেন, ভাবেন, লেখেন অথবা স্বপ্ন দেখেন। এগুলির মধ্যে ক’টি ভাষা আপনি ডিজিটাল স্পেসে ভাবের পরিপূর্ণ আদানপ্রদান এবং যোগাযোগের জন্য ব্যবহার করতে পারেন? অনলাইনে আপনার ভাষার, বা ভাষাগুলি ব্যবহার করার অভিজ্ঞতা কেমন? যে হার্ডওয়্যার আপনি ব্যবহার করেন, তাতে কি আপনার ভাষার অক্ষর ব্যবহার করা হয়? নিজের ভাষা ব্যবহার করার জন্য কি আপনাকে কীবোর্ড বদলাতে হয়? যখন আপনি সার্চ ইঞ্জিনে কোনো তথ্য খোঁজেন, তার উত্তর কি আপনি যে ভাষাতে চান, সেই ভাষাতে আসে? ইন্টারনেট ব্যবহার করার জন্য আপনাকে কি নিজের ভাষার বাইরে অন্য কোনো ভাষা শিখতে হয়েছে? এই প্রশ্নগুলির কোনোটির, বা অধিকাংশেরই উত্তর যদি “না” হয়, তাহলে আপনি এই দুনিয়ায় সুবিধাজনক অবস্থায় থাকা গুটিকয়েক মানুষদের মধ্যে একজন, যারা নিজের ভাষায় অনায়াসে ইন্টারনেট ব্যবহার করতে পারেন। এবং সেক্ষেত্রে আপনার ভাষা খুব সম্ভবত… ইংরেজি।

আমাদের জ্ঞান, যোগাযোগ, আর কাজের অন্যতম গুরুত্বপূর্ণ পরিকাঠামো এখন ইন্টারনেট ও তার বিভিন্ন ডিজিটাল স্পেস। কিন্তু এই পৃথিবীর ৭০০০ এরও বেশি ভাষার (কথ্য ও সাঙ্কেতিক ভাষা সহ) মধ্যে ক’টির অভিজ্ঞতা আমরা অনলাইনে পুরোপুরি পেতে পারি? সত্যিকারের বহুভাষিক ইন্টারনেট দেখতে, বুঝতে এবং শুনতে কেমন লাগতে পারে? এই প্রতিবেদন ওপরের প্রশ্নের উত্তর দেওয়ার একটি প্রচেষ্টা। আমরা তিনটি সংস্থার এক সমবায় হুজ নলেজ?, অক্সফোর্ড ইন্টারনেট ইন্সটিটিউট, এবং দ্য সেন্টার ফর ইন্টারনেট অ্যান্ড সোসাইটি (ভারত)। ইন্টারনেটের ভাষার পরিস্থিতি নিয়ে নানা উপলব্ধি, অভিজ্ঞতা ও বিশ্লেষণ তুলে ধরতে আমরা একত্রিত হয়েছি, এবং আরো যারা এই বিষয়গুলো নিয়ে ভাবনাচিন্তা চালাচ্ছেন, তাদের সঙ্গে সম্মিলিতভাবে আমরা আরও বহুভাষিক ইন্টারনেট, ডিজিটাল প্রযুক্তি ও অভ্যাস গড়ে তোলার আশা রাখি।

এই প্রতিবেদনের উদ্দেশ্য তিনটি:

  • ইন্টারনেটের বর্তমান ভাষাপরিস্থিতির একটি রূপরেখা তৈরী করা: আমরা বুঝতে চেষ্টা করছি ইন্টারনেটে বর্তমানে কোন ভাষাগুলির উপস্থিতি রয়েছে, এবং কেন? এই কাজটি আমরা সম্পাদন করছি পরিমাণগত তথ্য (বিভিন্ন ডিজিটাল প্ল্যাটফর্ম, টুলস ও স্পেসের পরিসংখ্যান বিশ্লেষণ করে) ও গুণগত তথ্যের (অনলাইনে ভাষাকে কেন্দ্র করে মানুষের নিজস্ব কাহিনি ও অভিজ্ঞতা থেকে শিক্ষা নিয়ে ) বিশ্লেষণের মধ্য দিয়ে।
  • ইন্টারনেটকে আরও বহুভাষিক করে তুলতে কী কী প্রতিবন্ধকতা এবং সুযোগ রয়েছে সেই ব্যাপারে সচেতনতা গড়ে তোলা বিশ্বের সমস্ত ভাষার জন্য প্রযুক্তি, ‘কন্টেন্ট’ এবং সম্প্রদায় গড়ে তোলার মধ্যে যেমন গভীর সমস্যা রয়েছে, তেমনই আছে দারুণ সুযোগ ও সম্ভাবনা। এই প্রতিবেদন তার মধ্যে থেকেই কিছু সমস্যা ও সম্ভাবনা তুলে ধরবে।
  • কর্মসূচি পেশ করা এইসকল চিন্তাভাবনা এবং সচেতনতাকে সামনে রেখে, আমরা কিছু পথনির্দেশ স্থির করতে চেষ্টা করব, যার সাহায্যে আমরা, এবং আমাদের মত আরো যারা বিশ্বজুড়ে এই বিষয়গুলি নিয়ে কাজ করে তারা ইন্টারনেটকে আরো বহুভাষিক করে তোলার পরিকল্পনা এবং কর্মপদ্ধতি স্থির করতে পারেন।

এই প্রতিবেদন কী? এবং কী নয়?

এই প্রতিবেদন একটি বিবর্তমান প্রক্রিয়া বা চলতে থাকা কাজ।

অসংখ্য ভিন্ন ভিন্ন ব্যক্তি, দল, ও সংস্থা বহু দিন ধরে ভাষার বিভিন্ন দিক নিয়ে, এবং সম্প্রতি অনলাইনেও ভাষার বিভিন্ন দিক নিয়ে কাজ করছেন। তাঁরা আমাদের অনুপ্রেরণা। কিন্তু এই প্রতিবেদন তৈরীর উদ্দেশ্য তাঁদের প্রত্যেকের কাজের পূর্ণাঙ্গ খতিয়ান পেশ করা নয়। তাছাড়া যাঁরা ভাষা ও ইন্টারনেট নিয়ে কাজ করছেন তাঁদের সকলকে আমরা চিনিও না। অবশ্য যাঁদের আমরা চিনি, এবং যাঁদের দ্বারা আমরা কোনো না কোনোভাবে অনুপ্রাণিত, তাঁদের অধিকাংশকেই আমরা আমাদের রিসোর্সকৃতজ্ঞতা অংশে অন্তর্ভুক্ত করেছি।

যতটুকু তথ্য আমরা জোগাড় করতে পেরেছি তার মধ্যেই আমাদের পরিসর সীমিত। পরিসংখ্যান অংশে এই সীমাবদ্ধতার কিছু কিছু আমরা আলোচনা করেছি। আমাদের দেওয়া তথ্যকে আরও উন্নত ও পরিবর্ধিত করে তুলতে আপনাদের মন্তব্য ও পরামর্শকে আমরা স্বাগত জানাই। যাঁরা এইসমস্ত বিষয়ে ইতোমধ্যেই কাজ করছেন, এবং ভবিষ্যতে এই প্রতিবেদনের পরিবর্ধিত সংস্করণের অন্তর্ভুক্ত হতে চাইবেন, আমরা তাঁদের অভিজ্ঞতা শুনতে আগ্রহী।

আমরা এই প্রতিবেদনটিকে যথাসম্ভব সহজবোধ্য ভঙ্গিতে লিখতে চেষ্টা করেছি। আমরা চাই বিভিন্ন প্রজন্ম ও সম্প্রদায়ের মানুষ এই কাজে আমাদের সঙ্গী হোন, এবং পরিভাষা বা “কেতাবি” ভাষা যাতে এই প্রতিবেদন পড়ার ও বোঝার ক্ষেত্রে বাধা হয়ে না দাঁড়ায়। আমরা আরো চাই যে, এটি যতগুলি সম্ভব ভাষায় অনূদিত হোক, (অনুবাদকরা: আমাদের সঙ্গে যোগাযোগ করুন!) এবং যদিও এই প্রতিবেদনের বেশ কিছু অংশ আমরা প্রথমে ইংরেজিতে লিখেছি, আমরা একেবারেই চাইনা যে ইংরেজি আমাদের চিন্তাভাবনা বা কাজের পথে বাধা হয়ে দাঁড়াক।

আশা রাখি অতীতের নানা উদ্যোগের উপর ভর করে বর্তমান প্রতিবেদনটি এই বিষয়ে পরবর্তী গবেষণা, আলোচনা এবং কাজের “প্রাথমিক ভিত্তি” হয়ে উঠবে।

আমরা কারা, আর কেনই বা আমরা এই প্রতিবেদন তৈরী করতে একত্রিত হলাম?

তিনটি সংগঠন একত্রিত হয়ে এই প্রতিবেদন তৈরীর জন্য গবেষণা চালিয়েছে: দ্য সেন্টার ফর ইন্টারনেট অ্যান্ড সোসাইটি, অক্সফোর্ড ইন্টারনেট ইন্সটিটিউট, এবং হুজ নলেজ?। আমরা প্রত্যেকেই গবেষণা, নীতি ও প্রচারের ভিন্ন ভিন্ন দৃষ্টিকোণ থেকে ইন্টারনেট ও ডিজিটাল প্রযুক্তির তাৎপর্য সম্পর্কে জানতে আগ্রহী।

গত কয়েক বছর ধরে আমরা নিজেদের মত করে ইন্টারনেটে জ্ঞানের অসাম্য ও অবিচারকে বোঝার চেষ্টা করছি: কারা অনলাইন কন্টেন্ট তৈরী করে এবং কীভাবে? শীঘ্রই আমরা বুঝলাম ইন্টারনেটে বিভিন্ন ভাষায় গড়ে তোলা জ্ঞান সম্পর্কে তথ্য খুবই কম। এরপর আমরা আরো জানতে চাইলাম: পৃথিবীর বিভিন্ন ভাষা ইন্টারনেটের ঠিক কতটা পরিসর জুড়ে রয়েছে? ইন্টারনেট কতটা বহুভাষিক? আমাদের অনুসন্ধান সেইসমস্ত জায়গাতেই সীমাবদ্ধ ছিল, যেখানে যেখানে আমরা ব্যবহারযোগ্য, মুক্ত ও সর্বজনীন তথ্য পেয়েছিলাম। কিন্তু আমরা আশা রাখি, আমরা, যারা বহুভাষিক ইন্টারনেট তৈরীর জন্য প্রয়াস চালাচ্ছি, তাদের জন্য এটি একটি অন্যতম অবদান হয়ে উঠবে।

কোভিড-১৯ এবং এই প্রতিবেদন নিয়ে কয়েকটি কথা: আমরা ২০১৯ সালে কোভিড-১৯ অতিমারীর আগে এই প্রতিবেদনের কাজ শুরু করেছিলাম। কিন্তু অধিকাংশ বিশ্লেষণমূলক কাজ, সাক্ষাৎকার, এবং লেখালিখি বৈশ্বিক অতিমারীর মধ্যেই করা হয়েছে, যে অতিমারী আমাদের ব্যক্তিগত জীবনের পাশাপাশি সমষ্টিগত জীবনকেও বদলে দিয়েছে৷ যাঁরা এই প্রতিবেদনের কাজে অংশ নিয়েছিলেন, প্রত্যেকে কোনো না কোনোভাবে এর দ্বারা প্রভাবিত হয়েছেন, এবং আমরা যা অনুমান করেছিলাম, এই প্রতিবেদন সকলের সঙ্গে ভাগ করে নিতে তার চাইতে অনেক বেশি সময় লেগেছে। কিন্তু কোভিড -১৯ আমাদের এই কথাও মনে করিয়ে দিয়েছে, যে আমরা একে-অপরের সঙ্গে কতটা সংযুক্ত, বিভিন্ন ভাষায় বিচিত্র চিন্তাভাবনার চর্চা করা আমাদের জন্য কতটা প্রয়োজনীয়, এবং স্থিতিশীল ও সহজে ব্যবহারযোগ্য (ডিজিটাল) পরিকাঠামো, যা সত্যিকার অর্থে বহুভাষিক, তা থাকা কতটা জরুরি।

এই প্রতিবেদন কীভাবে পড়তে হবে?

আমরা এই প্রতিবেদনকে বলছি “ডিজিটাল ফার্স্ট”। এটি পড়ার, শোনার, এবং এর থেকে শেখার সেরা উপায় হল এই ওয়েবসাইট, কারণ এই প্রতিবেদনের কয়েকটি স্তর ও ধাপ রয়েছে। আমাদের এই প্রতিবেদন পরিসংখ্যানবিবরণ -কে একসাথে এনেছে। পরিসংখ্যানের নিরীখে অনলাইনে ইন্টারনেটের ভাষাপরিস্থিতি বিশ্লেষণ করলে সংশ্লিষ্ট বিষয়গুলি সম্পর্কে একটি সামগ্রিক ধারণা পাওয়া যায়, এবং মানুষ যে বিচিত্র অভিজ্ঞতার সম্মুখীন হচ্ছেন, তার ভিন্ন ভিন্ন প্রেক্ষাপট বুঝতেও সুবিধা হয়। কিন্তু বিশ্বজুড়ে ইন্টারনেটের ভাষাপরিস্থিতি নিয়ে বিভিন্ন প্রসঙ্গে মানুষের অভিজ্ঞতার বিবরণ আমাদের আরো গভীরভাবে বুঝতে সাহায্য করে যে, মানুষজনের পক্ষে তাদের নিজেদের ভাষায় ইন্টারনেট ব্যবহার করতে পারা কতটা সহজ বা কঠিন। সংখ্যা এবং বিবরণ -উভয়ের সাহায্যেই আমরা অন্তর্নিহিত প্রসঙ্গ, সমস্যা ও সম্ভাবনার দিকগুলি বোঝা শুরু করতে পারি।

এই কারণে এই প্রতিবেদনের তিনটি প্রধান স্তর:

  • ইন্টারনেটের ভাষাপরিস্থিতি প্রতিবেদনে কি কি আছে তার সারসংক্ষেপ, এবং কীভাবে আমরা এটা তৈরি করলাম (যা আপনি এখন পড়ছেন)।
  • আমরা প্রতিদিন যেসব ডিজিটাল প্ল্যাটফর্ম, অ্যাপ এবং ডিভাইস ব্যবহার করি পরিসংখ্যান তার কয়েকটির কিছু কিছু ভাষা বিষয়ক সমস্যা বিশ্লেষণ করেছে। আমাদের অক্সফোর্ড ইন্টারনেট ইন্সটিটিউটের বন্ধুরাই এই কাজে নেতৃত্ব দিয়েছেন। তাদের চমৎকার ডেটা ভিজুয়ালাইজেশন এবং বিশ্লেষণ আপনি এখানে পাবেন। এখানে বলে রাখা দরকার যে এই বিশ্লেষণ, যতটুকু তথ্য আমরা জোগাড় করতে পেরেছি, তার মধ্যেই সীমাবদ্ধ, এই তথ্য আমরা পেয়েছি মুক্ত ও সর্বসাধারণের আয়ত্তে থাকা তথ্যভান্ডার থেকে। বাকি পদ্ধতিগত সীমাবদ্ধতা এই প্রবন্ধগুলিতে বিশদে আলোচনা করা হয়েছে। কিন্তু সবচেয়ে গুরুত্বপূর্ণ কথা হল, ভাষাগুলিকে চিহ্নিত করার কোনো একক, নির্ভরযোগ্য উপায় খুঁজে বের করা বেশ কঠিন, আবার একেকটি ভাষা ঠিক কতজন মানুষ ব্যবহার করেন তার হদিশ পাওয়াও ততটাই কঠিন; বিশেষতঃ, ভাষা ও এর ব্যবহার যেখানে বহমান এবং তা সময়ের সঙ্গে সঙ্গে বদলাচ্ছে।
  • বিবরণ থেকে আমরা গভীরভাবে বুঝতে পারি কীভাবে বিশ্বের বিভিন্ন সম্প্রদায় ও মানুষ তাদের নিজেদের ভাষায় ইন্টারনেটের অভিজ্ঞতা লাভ করে, এবং বহু ক্ষেত্রেই দেখা যায়, তাঁদের নিজেদের ভাষায় তথ্য খুঁজে পাওয়া এই মুহূর্তে কতটা কঠিন। এইসমস্ত বিবরণগুলিকে আমরা আমন্ত্রণ করেছিলাম লেখা ও কথার আকারে, ফলে এখানে আপনি লিখিত প্রবন্ধের পাশাপাশি অডিও এবং ভিডিও সাক্ষাৎকারও পাবেন। আমাদের দ্য সেন্টার ফর ইন্টারনেট অ্যান্ড সোসাইটির বন্ধুরা বিশ্বের ভাষা-অভিজ্ঞতার এই চমৎকার বুননের কাজে নেতৃত্ব দিয়েছেন। নানা আদিবাসী ভাষাগোষ্ঠী থেকে আমরা সাড়া পেয়েছি, তার মধ্যে আছে আফ্রিকা, আমেরিকা ও অস্ট্রেলিয়ার চিন্দালি, ক্রি, ওজিবোয়ে, মাপুজুগুন, জাপোটেক এবং আর্রের্ন্টে, ইউরোপের সংখ্যালঘু ভাষা ব্রেটন, বাস্ক, সার্ডিনিয়ান ও কারেলিয়ান; এছাড়াও রয়েছে, স্থানীয় ও পৃথিবীজুড়ে প্রভাবশালী ভাষা, যেমন এশিয়ার বাংলা, ইন্দোনেশীয় (বাহাসা ইন্দোনেশিয়া) আর সিংহলি, এবং উত্তর আফ্রিকা জুড়ে ছড়িয়ে থাকা বিভিন্ন ধরণের আরবি ভাষা।

সবচেয়ে জরুরি কথা, আমাদের সহায়করা তাদের নিজেদের ভাষার পাশাপাশি ইংরেজিতেও লিখেছেন বা বলেছেন, এবং আমাদের এই সংক্ষিপ্ত প্রতিবেদনও বিভিন্ন ভাষায় বলা ও লেখা হয়েছে। অতএব আমরা আশা করি, এই প্রতিবেদনটি আপনি একাধিক ভাষায় পড়তে বা শুনতে পছন্দ করবেন।

এইসমস্ত বিবরণকে চাক্ষুষভাবে প্রাণবন্ত করে তোলার সর্বোচ্চ চেষ্টাও আমরা করেছি। নানা কাল্পনিক অলঙ্করণ এবং অ্যানিমেশনের সাহায্যে যত্ন নিয়ে ভাষার বিভিন্ন টেকনিক্যাল ও সামাজিক দিকগুলোকে একসাথে ধরার চেষ্টা করা হয়েছে। আমাদের প্রতিবেদনের সবটাই দশে মিলে করা কাজ, তাই এই অলঙ্করণগুলিও কন্ট্রিবিউটর আর অলঙ্করণশিল্পীরা পারস্পরিক আলোচনার মাধ্যমে সম্পন্ন করেছেন।

ইন্টারনেট ঠিক কতটা বহুভাষিক?

ইন্টারনেট এখনও আমাদের বাস্তব জীবনের মত বহুভাষিক তো নয়ই, দুঃখজনকভাবে, তার ধারেকাছেও নয়। এর কারণ আমরা বুঝতে চেষ্টা করি বিশ্বজুড়ে মানুষের কিছু পরিসংখ্যানঅভিজ্ঞতা দুটোই একসাথে দেখে। এখানে আমরা আপনাদের সারা বিশ্বে ছড়িয়ে থাকা আমাদের সহায়কদের কাজের সমৃদ্ধি ও গভীরতার কেবলমাত্র একটা সংক্ষিপ্ত সারাংশ ও বিশ্লেষণ জোগান দিতে পারছি, অতএব আরো বিশদে জানতে ও অনুপ্রেরণা পেতে অনুগ্রহ করে ওঁদের প্রবন্ধগুলি পড়ুন।

প্রথমে আমরা দেখব কী কী প্রসঙ্গে দুনিয়ার নানা জায়গার মানুষ বিভিন্ন ভাষায় ইন্টারনেট ব্যবহার করেন। আমরা দেখব কীভাবে পৃথিবীর বিভিন্ন ভৌগোলিক অংশে ও ভাষায় জ্ঞান এবং তথ্য ছড়ানো আছে, অথবা নেই। তারপর আমরা খুঁটিয়ে দেখব বিষয়বস্তু তৈরি, ভাব বিনিময়, এবং অনলাইনে তথ্য ভাগ করে নেওয়ার যেসব মুখ্য প্ল্যাটফর্ম ও অ্যাপ্লিকেশন রয়েছে সেগুলির প্রত্যেকটি কোন কোন ভাষায় উপলব্ধ। যেহেতু গুগল মানচিত্র এবং উইকিপিডিয়া এমন দুটি বহুভাষিক কন্টেন্ট স্পেস -যা আমরা সকলে রোজই ব্যবহার করি, সেহেতু আমরা বিশদে দেখব বিভিন্ন ভাষায় এরা কীভাবে কাজ করে।

আমাদের এই যাত্রাপথে, মানুষজন তাদের নিজেদের ভাষায় কীভাবে ইন্টারনেট ব্যবহার করছেন ও জ্ঞানচর্চায় নিজেদের অবদান রাখছেন তার গল্প এবং অভিজ্ঞতার বিবরণ আমরা ভাগ করে নেব। যেমনটা আমরা জেনেছি, আমাদের অধিকাংশ সহায়ককেই ইন্টারনেট ব্যবহার করতে ও তাদের কাছে জরুরি বিষয়গুলিতে নিজেদের কন্ট্রিবিউশন রাখতে, তাদের প্রাথমিক ভাষা থেকে সরে এসে অন্য একটি ভাষাকে বেছে নিতে হয়েছে।

ভৌগোলিক ও ডিজিটাল জ্ঞান-অসাম্য : ভাষার প্রসঙ্গে

«মৌখিক ঐতিহ্যনির্ভর ভাষা আজকের ওয়েবে খাপ খায় না।»

«আমাদের মনে হয় যে, এই প্ল্যাটফর্মগুলো, সাধারণভাবে, কোনো কোনো ভাষা বেশি দামী এবং তাদের ভাব বিনিময় করার ক্ষমতা অন্য ভাষার চাইতে বেশি -এইরকম উপনিবেশবাদী মানসিকতাকেই বজায় রাখে। -এই দৃষ্টিভঙ্গির ফলে মাপুজুগুনের মত সংখ্যালঘু ভাষা মার খায়।»

আমরা জানি যে বিশ্বের ৬০% -এরও বেশি এখন ডিজিটালি সংযুক্ত, অধিকাংশই ফোন এবং মোবাইল ডিভাইসের মাধ্যমে। যারা অনলাইনে আছে, তাদের তিন চতুর্থাংশ আমাদের গ্লোবাল সাউথ থেকে: এশিয়া, আফ্রিকা, লাতিন আমেরিকা, ক্যারিবিয়ান ও প্রশান্ত মহাসাগরীয় দ্বীপপুঞ্জ। কিন্তু ইন্টারনেটের দুনিয়ায় আমাদের অধিগম্যতা কতটা তাৎপর্যপূর্ণ ও সুষম? অনলাইনে সর্বজনীন জ্ঞান যতটা আমরা ব্যবহার করি, ততটা কী তৈরী করতে পারি?

ইন্টারনেট ব্যবহারকারীদের সাপেক্ষে বিশ্বের জনসংখ্যার তুলনাকারী মার্টিন এবং মার্কের সার্ভে-তে আমরা পাই যে, জনসাধারণের কিছু বিশেষ অংশ, নানা সুপরিচিত ডিজিটাল স্পেস সহ ইন্টারনেট -বাকিদের থেকে অনেক বেশি অর্থবহভাবে ব্যবহার করেন। উদাহরণ হিসেবে বলা যায়, এমনকি, অনলাইনে থাকা অধিকাংশ মানুষই গ্লোবাল সাউথ-থেকে হওয়া সত্ত্বেও আমরা অনলাইনে তথ্য উৎপাদন বা জ্ঞান সৃষ্টির কাজে নয়, ইন্টারনেট ব্যবহার করতে পারি কেবলমাত্র উপভোক্তা হিসেবে। উইকিপিডিয়ার বেশিরভাগ সম্পাদনা, গিটহাবের (‘কোড’-এর এক অনলাইন ভান্ডার) অধিকাংশ অ্যাকাউন্ট, এবং সবচেয়ে বেশি টর ব্যবহারকারীর (একটি নিরাপদ ব্রাউজার) সকলেই ইউরোপ ও উত্তর আমেরিকার।

পৃথিবীর বিভিন্ন অঞ্চলভিত্তিক ডিজিটাল অংশগ্রহণের পরিমাপ। (তথ্য: বিশ্ব ব্যাঙ্ক ২০১৯, উইকিমিডিয়া ফাউন্ডেশন ২০১৯, উইকিপিডিয়া ২০১৮, গিটহাব ২০২০, টর ২০১৯) [PDF↓]

অধিগম্যতার এই অসাম্য ভাষার ক্ষেত্রে কী বোঝায়? আমরা প্রত্যেকে কি নিজের নিজের ভাষায় ইন্টারনেট ব্যবহার করতে পারি? আমরা কি নিজের নিজের ভাষায় বিষয়বস্তু এবং তথ্য উৎপাদন করতে পারি?

অন্যান্য অভিজ্ঞ অনুমান আমাদের দেখায়, ৭৫% -এরও বেশি ইন্টারনেট ব্যবহারকারী মাত্র ১০টি ভাষায় ইন্টারনেট ব্যবহার করে। -এই ভাষাগুলির বেশিরভাগেরই ইউরোপীয় ঔপনিবেশিক ইতিহাস রয়েছে (ইংরেজি, ফরাসি, জার্মান, পর্তুগিজ, স্প্যানিশ…) অথবা এরা সেইসব নির্দিষ্ট অঞ্চলে প্রভাবশালী, যেখানে অন্য ভাষাগুলি প্রাসঙ্গিক থাকার জন্য সংগ্রাম করে (চীনা, আরবি, রাশিয়ান…)। ২০২০ সালে মোটামুটি হিসেব করা হয়েছিল যে ইন্টারনেট ব্যবহারকারীদের ২৫.৯% অনলাইনে এসেছে ইংরেজি ভাষা ব্যবহার করে ১৯.৪% ইন্টারনেট ব্যবহার করেছে চীনা ভাষায়। বিশ্বের সবচেয়ে বেশি ইন্টারনেট ব্যবহারকারী চীন দেশের, এবং মনে রাখা দরকার, যে আমরা যাকে “চীনা” বলি তা কোনো একটি একক ভাষা নয়, বরং বিভিন্ন ভাষার এক গোষ্ঠী

খেয়াল করবার বিষয় এই, যদিও বর্তমানে ইন্টারনেটে সবচেয়ে বেশি ব্যবহৃত ভাষাগুলির অধিকাংশের উৎসই ইউরোপীয়, কিন্তু বিশ্বের অন্য মহাদেশগুলির তুলনায় ইউরোপের ভাষাবৈচিত্র সবচেয়ে কম। বিশ্বের ৭০০০+ ভাষার মধ্যে ৪০০০ -এর বেশি এশিয়া এবং আফ্রিকা থেকে এসেছে (এক-একটিতে ২০০০-এরও বেশি), এবং প্রশান্ত মহাসাগরীয় দ্বীপপুঞ্জ ও আমেরিকার প্রতিটিতে ১০০০-টির বেশি ভাষা রয়েছে। পাপুয়া নিউ গিনি ও ইন্দোনেশিয়া হল সবচেয়ে বেশি ভাষাবৈচিত্রের দেশ পাপুয়া নিউ গিনি তে ৮০০-এরও বেশি এবং ইন্দোনেশিয়ায় ৭০০-র বেশি।

বিশ্ব জুড়ে অঞ্চল অনুসারে ভাষার সংখ্যা এবং ভাষাভাষীদের মোট জনসংখ্যা। উৎস: Ethnologue [PDF↓]

যারা তাদের প্রাথমিক (অথবা স্থানীয়) ভাষা হিসেবে কোনো ভাষায় কথা বলেন, তাদের সংখ্যা অনুযায়ী, দক্ষিণ এশিয়ার অনেক ভাষা (হিন্দি, বাংলা, উর্দু…) বিশ্বের শীর্ষস্থানীয় ১০টি ভাষার মধ্যে আছে। কিন্তু দক্ষিণ এশিয়ার মানুষেরা এইসব ভাষায় ইন্টারনেট ব্যবহার করতে পারেন না। এবং অবশ্যই, যেমনটা আমরা ঈশান, যার প্রথম ভাষা বাংলা, তার কাছ থেকে জানতে পারি, যদি আপনি নিজের পছন্দের ভাষায় ডিজিটাল মাধ্যমে তথ্য পেয়েও যান, যে ধরণের তথ্য আপনি খুঁজছেন, তা না-ও পেতে পারেন। ঈশানের ক্ষেত্রে যেমন, প্রতিবন্ধকতা ও যৌনতার অধিকার সম্পর্কিত তথ্য। দক্ষিণ-পূর্ব এশিয়া, যা বিশ্বের সবচেয়ে বেশি ইন্টারনেট ব্যবহার হওয়া অঞ্চলগুলির অন্যতম, এবং পৃথিবীতে ভাষাবৈচিত্র্যের শীর্ষস্থানীয় এলাকাগুলিরও অন্যতম, সেখানকার পরিস্থিতিও একইরকম। পাস্কা ইন্দোনেশীয় ভাষায় (বাহাসা ইন্দোনেশিয়া) যৌন অধিকার বিষয়ক তথ্য খুঁজতে গিয়ে ঠিক একইভাবে আটকে গেছে, যেমনটা ঈশান বাংলায়।

আমরা আরও জানি যে বিশ্বের ৭০০০-টিরও বেশি ভাষার মধ্যে প্রায় ৪০০০-টির লিখিত রূপ বা লিপি আছে। যাহোক, এই লিপিগুলির অধিকাংশই সেই ভাষাগুলিতে যারা কথা বলেন —তাদের হাতে তৈরি হয়নি, বরং এগুলি বিশ্বজুড়ে অজস্র ঔপনিবেশিকরণ প্রক্রিয়ার অংশ হিসেবে উঠে এসেছে। কোনো লিপি থাকা মানেই এই নয় যে সকলে তা বোঝেন, বা বহুল ব্যবহৃত হয়। বিশ্বের অধিকাংশ ভাষাই লেখার বদলে কথ্য বা সাংকেতিক পদ্ধতিতে সম্প্রচারিত হয়। এমনকি যে ভাষাগুলির লিখিত রূপ রয়েছে, তাদের মধ্যে অধিকাংশ প্রকাশনাই ইউরোপীয় ঔপনিবেশিক ভাষায়, এবং আঞ্চলিকভাবে প্রভাবশালী ভাষাগুলিতে সেই তুলনায় অনেক কম। ২০১০ সালে গুগলের আনুমানিক হিসেব অনুযায়ী প্রায় ১৩ কোটি বই এখনও অবধি প্রকাশিত হয়েছে এবং সেগুলির একটি বড় অংশ ৪৮০টি ভাষায়। সবচাইতে সুপ্রতিষ্ঠিত অ্যাকাডেমিক গবেষণা পত্রিকা, যেগুলির বিষয় বিজ্ঞান অথবা সমাজবিজ্ঞান ইংরেজি ভাষায় প্রকাশিত। বিশ্বের সর্বাধিক ভাষায় অনূদিত বই হল বাইবেল (৩০০০টিরও বেশি ভাষায়), এবং বিশ্বের সর্বাধিক ভাষায় অনূদিত নথি হল জাতিসংঘের মানবাধিকারের সর্বজনীন ঘোষণা (৫০০টিরও বেশি ভাষায়)।

কেন এই আলোচনা জরুরি? কারণ ডিজিটাল ভাষা-প্রযুক্তি তাদের ভাষা-সাপোর্ট ও লেখা আরো উন্নত করার জন্য প্রকাশিত বিষয়গুলির স্বয়ংক্রিয় প্রক্রিয়াকরণের ওপর নির্ভর করে। কাজেই, যখন সারা বিশ্বে লিখিত পাঠ্যবস্তুর প্রকাশনা এমনিতেই কয়েকটি ভাষার প্রতি পক্ষপাতী, এবং কোনো অ-লিখিত ভাষাকে এর অন্তর্ভুক্ত করতে পারে না, তখন আমাদের ভাষা-বৈষম্য আরো গভীর হয়। এবং অবশ্যই, অলিখিত ভাষাগুলি, যেগুলি সঙ্কেত, শব্দ, অঙ্গভঙ্গি, নড়াচড়ার ওপর নির্ভরশীল, সেগুলি প্রকাশনার জগতে সম্পূর্ণ ব্রাত্য, এবং তার ফলে প্রায়শঃই ডিজিটাল ভাষা প্রযুক্তিতেও তাদের ঠাঁই হয় না।

ধরা যাক, অ্যানা-র কথা, যেমনটা ও আমাদের বলেছে, “ওয়েব চিরাচরিতভাবে কথ্য ভাষা ব্যবহারকারীদের জন্য নির্মান করা হয়নি।” ইন্টারনেটে লিখিত ভাষার এই আধিপত্যের মধ্যে চিরাচরিতভাবে কথ্য এবং দৃশ্য-ভাষায় বিষয়বস্তু খুঁজে পাওয়া বেশ কঠিন। আমরা সহজে অঙ্গভঙ্গি, সঙ্কেত বা শিষ দেওয়া ভাষা অনুসন্ধান করতে পারি না। উদাহরণস্বরূপ, জোয়েল এবং ক্যাডির সাথে আমাদের সাক্ষাৎকারে তারা আমাদের অস্ট্রেলিয়ার মু-বান টুয়া/অ্যালিস স্প্রিংসের আর্রেন্টে ভূমিতে তৈরি প্রথম একগুচ্ছ দেশীয় ইমোজি সম্পর্কে জানায়। আরো জানায়, কীভাবে আর্রেন্টে ভাষায় অর্থ তৈরি করতে কথ্য শব্দের সঙ্গে প্রায়শঃই শারীরিক ভঙ্গি যুক্ত করতে হয়। এমনা তিউনিশিয়া ও সেখানকার লোকজনের কথ্য বিভিন্ন ভাষা সম্পর্কে একই কথা বলে: “যখন কোনো ভাষা সংরক্ষণের প্রসঙ্গ আসে, তখন আমাদের শুধুমাত্র লেখার দিকে নজর দিলে চলবে না, এটা আমাদের মৌখিক রূপে, অঙ্গভঙ্গি, সঙ্কেত, শিস ইত্যাদির মাধ্যমেও করতে হবে। যা লিখিত রূপে পুরোপুরি ধরতে পারা যায় না।

লিপি, শব্দ, অঙ্গভঙ্গি ও আরো নানা কিছু দিয়ে গড়া ভাষার বহুত্বের প্রতিনিধিত্ব করবার পক্ষে ডিজিটাল প্রযুক্তিগুলি খুবই সম্ভাবনাময়। এছাড়াও, যেসব ভাষা বিলুপ্তির দিকে এগোচ্ছে: সমগ্র ভাষার ৪০%-এরও বেশি সেগুলিকে সংরক্ষণ ও পুনরুজ্জীবিত করতে ডিজিটাল প্রযুক্তি আমাদের সাহায্য করতে পারে। প্রত্যেক মাসে দু'টি করে আদিবাসী ভাষা এবং সেই ভাষার যাবতীয় জ্ঞানভান্ডার চিরতরে আমাদের কাছ থেকে মুছে যায়। কেন এইসব ভাষার প্রসঙ্গ অনলাইনে আরো ভালভাবে উপস্থাপন করা হয় না? ক্লডিয়া তার প্রবন্ধে ভাষা ও প্রযুক্তির আন্তঃসম্পর্ক বোঝাতে গিয়ে ত্রিমাত্রিক দৃষ্টিকোণের কথা বলেছেন: লভ্যতা, ব্যবহারযোগ্যতা এবং কীভাবে প্রযুক্তি বিকশিত হয়। এই প্রতিবেদন জুড়ে যেমনটা আমরা দেখতে পাই, যাকে ক্লডিয়া বলছেন “সংখ্যাগরিষ্ঠ ভাষা” (যার সিংহভাগই ইউরোপীয় ঔপনিবেশিক ভাষা অথবা আঞ্চলিক প্রভাবশালী ভাষা) সেগুলিতে গণমাধ্যম, পরিষেবা, ইন্টারফেস ও অ্যাপের বিপুল সম্ভার রয়েছে। যেখানে অন্য ভাষাগুলিতে কীবোর্ড, যন্ত্রদ্বারা অনুবাদ বা কণ্ঠ শনাক্তকরণের মত পরিকাঠামো সহ উপরের সবকিছুরই উপস্থিতি তুলনায় অনেক কম। প্রযুক্তি কোম্পানিগুলিও এইসব সংখ্যাগরিষ্ঠ ভাষার পেছনে অনেক বেশি সময় ও সম্পদ খরচ করে, কারণ এখানেই তারা সবচেয়ে বেশি লাভ দেখতে পায়। পরিশেষে, ক্লডিয়া দেখতে পান অধিকাংশ ভাষা প্রযুক্তি হয় টপ ডাউন পদ্ধতিতে (উপর থেকে চাপিয়ে দেওয়া), সেই ভাষা সম্প্রদায়ের সঙ্গে খুব সামান্য সমন্বয়ের মধ্য দিয়ে তৈরি করা হয়েছে, নাহয় ভাষা সম্প্রদায়ের সঙ্গে একসাথে কাজ করার যে গুটিকয়েক প্রচেষ্টা দেখা গিয়েছে, সেগুলিতে পর্যাপ্ত পরিকল্পনা ও সমন্বয়ের অভাব রয়েছে। আবার, প্রাসঙ্গিক এইসমস্ত সমস্যা ও উদ্বেগ আমাদের আরো বহুভাষিক ইন্টারনেট তৈরির পথ করে দেয়, এবং আমরা এইসমস্ত সম্ভাবনার বিষয়ে পরে আসব।

ভাষা সাপোর্ট: প্ল্যাটফর্ম ও মেসেজিং অ্যাপসমূহ

«আপনি যখন “গুড মর্নিং” -শব্দটি লিখবেন, আপনি লেখা শেষ করার আগেই দেখা যাবে ফোন অথবা কম্পিউটার শব্দটি প্রস্তাব করছে। যখন আমি এই একই শব্দ চিন্দালিতে লিখছি (“মওয়ালামুশা”), তখন আমাকে পুরো শব্দটিই লিখতে হবে -এতে অনেক সময় লাগে; এবং এর নিচে দাগ আসবে, কারণ কম্পিউটার বা ফোন এই শব্দটি চিনতে পারে না।»

«সিংহলি ও তামিল অক্ষরের কীবোর্ড বিরল। আমাদের বাবা-মায়েরা সিংহলি অক্ষর ছোট্ট ছোট্ট করে ছাপাতেন, তারপর সেগুলো কেটে মূল ইংরেজি অক্ষরের পাশে কীগুলিতে সেঁটে দিতেন। যদিও অসংখ্য সিংহলি ফন্ট তৈরি হয়েছে, কিন্তু কোনোটাই ইউনিকোড ফন্টের মত কাজ করে না।»

«দি শীঘ্রই ব্রেটন ভাষায় জনপ্রিয় অ্যাপ ও সফটওয়্যার ইন্টারফেসগুলি পাওয়া না যায়, তাহলে ফরাসি অ্যাপগুলির সঙ্গে প্রতিযোগিতায় পেরে না উঠে অবধারিতরূপে তরুণ প্রজন্মের কাছে ভাষাটির আবেদন কমে যাবে।»

আমরা আরও গভীরে গিয়ে বুঝতে চেষ্টা করেছি যে, কেন ইন্টারনেট এখনও আমাদের বাস্তব পৃথিবীর মত এতটা বহুভাষিক নয়। সেখানে আমরা দেখেছি প্রধান প্রধান ডিজিটাল প্ল্যাটফর্ম ও অ্যাপ্লিকেশনগুলি আমাদের নিজেদের ভাষায় যোগাযোগ সাধন, কন্টেন্ট তৈরী ও তা ভাগ করে নিতে কোন ধরনের ভাষা সহায়তা (অর্থাৎ বিভিন্ন ভাষায় ব্যবহারকারী-ইন্টারফেস) যোগান দেয়।

বিভিন্ন ভাষায় উইকিপিডিয়া ইন্টারফেস।

মার্টিন ও মার্ক ১১টি ওয়েবসাইট, ১২টি অ্যান্ড্রয়েড অ্যাপ এবং ১৬টি আই-ও-এস অ্যাপের ভাষা সহায়তা (ল্যাঙ্গুয়েজ সাপোর্ট) বিশ্লেষণ করেছেন। তারা বহুল ব্যবহৃত প্ল্যাটফর্মগুলি বেছে নিয়েছেন, যেগুলি জ্ঞান আহরণ ও ভাগ করে নেওয়ার ক্ষেত্রে বিশেষ পারদর্শী। বিশেষ করে যেগুলির উপস্থিতি এবং শ্রোতা বিশ্বব্যাপী। তাঁদেরকে এইসব প্ল্যাটফর্ম ও অ্যাপগুলির ক্ষেত্রে সর্বজনীনভাবে উপলব্ধ তথ্যের উপরেও নির্ভর করতে হয়েছে, একইসঙ্গে, কণ্ঠের বদলে লিখিত পাঠ্যবস্তু ও কনটেন্টকে কেন্দ্র করে কাজটি সম্পাদন করতে হয়েছে।

প্ল্যাটফর্মগুলিকে চারটি বিস্তৃত ভাগে ভাগ করা হয়েছিল (তারা ওভারল্যাপ করছে একথা স্বীকার করে):

  • জ্ঞান আহরণ (সার্চ ইঞ্জিনগুলি সহ জ্ঞান ও তথ্যের প্ল্যাটফর্মসমূহ): গুগল মানচিত্র, গুগল সার্চ, উইকিপিডিয়া, ইউটিউব।
  • ভাষা শিক্ষা (স্ব-নির্দেশিত ভাষা শিক্ষার প্ল্যাটফর্মসমূহ): ডুওলিঙ্গো, এবং শিক্ষা প্ল্যাটফর্মগুলি- কোর্সেরা, ইউডাসিটি, ইউডেমি।
  • সামাজিক মাধ্যম (জনসাধারণ অভিমুখী সামাজিক মাধ্যমের প্ল্যাটফর্মগুলি): ফেসবুক, ইন্সটাগ্রাম, স্ন্যাপচ্যাট, টিকটক, ট্যুইটার।
  • মেসেজিং (ব্যক্তিগত এবং গ্রুপ মেসেজিং): ইমো, কাক্যাও টক, লাইন, লাইন লাইট, মেসেঞ্জার, কিউকিউ, সিগনাল, স্কাইপ, টেলিগ্রাম, ভাইবার, উইচ্যাট, হোয়াটসঅ্যাপ, জুম।
প্ল্যাটফর্মের বিভাগ অনুযায়ী প্রতিটি প্ল্যাটফর্মে সমর্থিত ইন্টারফেস-ভাষার সংখ্যা। [PDF↓]

আমরা দেখেছি যে, বিভিন্ন ডিজিটাল প্ল্যাটফর্ম জুড়ে পাঠ্য-ভিত্তিক ভাষা সহায়তা অত্যন্ত অসমভাবে বন্টন করা হয়েছে। উইকিপিডিয়া, গুগল সার্চ এবং ফেসবুকের মত বৃহৎ ওয়েব প্ল্যাটফর্মগুলি এই মুহূর্তে সবচেয়ে বেশি ভাষা সাপোর্ট দেয়। মজার বিষয় হল উইকিপিডিয়া (যা একটি অলাভজনক প্ল্যাটফর্ম, এবং বিশ্বজুড়ে স্বেচ্ছাসেবকদের দ্বারা সম্পাদিত) এখনও অবধি সবচেয়ে ব্যাপকমাত্রায় অনূদিত প্ল্যাটফর্ম। উইকিপিডিয়া একটি প্রাথমিক ব্যবহারকারী ইন্টারফেস সহ প্রায় ৪০০টির বেশি ভাষা সাপোর্ট করে, যার মধ্যে প্রায় ৩০০-টি ভাষায় অন্ততঃ ১০০টি করে নিবন্ধ রয়েছে। গুগল অনুসন্ধান ১৫০টি ভাষা সাপোর্ট করে, এবং ফেসবুক ৭০-১০০টি সাপোর্টেড ভাষা সহ উপলব্ধ। মেসেজিং অ্যাপগুলির মধ্যে সিগনাল প্রথমে আছে অ্যান্ড্রয়েডে প্রায় ৭০টি, এবং আই-ও-এস-এ ৫০টি ভাষা সহ। অন্যদিকে, অধিকাংশ প্ল্যাটফর্মের ভাষা সাপোর্টই বেশিরভাগ ভাষাকে ব্রাত্য করে অল্পসংখ্যক বহুল ব্যবহৃত ভাষার উপর জোর দেয়। উদাহরণস্বরূপ, কিউকিউ নামের মেসেঞ্জার অ্যাপটি শুধুমাত্র চীনা ভাষা সাপোর্ট করে।

জরিপ করা অধিকাংশ প্ল্যাটফর্মেরই যে কতিপয় ভাষাগুলি ব্যবহারের ঝোঁক রয়েছে সেগুলির মধ্যে আছে ইংরেজি, স্প্যানিশ, পোর্তুগিজ এবং ফরাসির মত ইউরোপীয় ভাষা, সেইসঙ্গে নির্দিষ্ট কিছু এশীয় ভাষা, যেমন- ম্যান্ডারিন চীনা, ইন্দোনেশিয়ান, জাপানি ও কোরিয়ান। প্রধান ভাষাগুলির মধ্যে আরবি ও মালয় কম সাপোর্টেড, এবং অন্য যেসব ভাষায় এক থেকে দশ কোটি মানুষ কথা বলেন সেগুলি ইন্টারফেস সাপোর্ট ভালোভাবে পায় না।

বিশ্বের বেশিরভাগ মানুষের ক্ষেত্রে এই ভাষা সাপোর্টে ঘাটতির মানে কী? ২০২১ সালে আমাদের আনুমানিক হিসেব অনুযায়ী সমগ্র বিশ্বে প্রায় ৭৯০কোটি মানুষ, যাদের অধিকাংশই এশিয়া (প্রায় ৪৭০ কোটি) ও আফ্রিকার (প্রায় ১৪০ কোটি) অধিবাসী। অথচ বিশ্বের অধিকাংশই ইন্টারনেটের ভাষাগুলির সুবিধা থেকে বঞ্চিত:

  • যারা আফ্রিকান ভাষাগুলিতে কথা বলছেন: আফ্রিকান ভাষাগুলির বেশিরভাগই আমাদের সমীক্ষা করা কোনো প্ল্যাটফর্মের ইন্টারফেস ভাষা হিসেবে ব্যবহৃত হয়নি। এর ফলে ৯০% আফ্রিকানকেই এই প্ল্যাটফর্মগুলি ব্যবহার করতে একটি দ্বিতীয় ভাষার শরণাপন্ন হতে হয়। -অনেকের ক্ষেত্রেই এর অর্থ হতে পারে কোনো ইউরোপীয়-ঔপনিবেশিক ভাষা অথবা সেই অঞ্চলের কোনো একটি বেশি প্রভাবশালী ভাষা বেছে নেওয়া।
  • যারা দক্ষিণ এশীয় ভাষাগুলিতে কথা বলছেন: দক্ষিণ এশিয়ায় জরিপ করা অর্ধেক প্ল্যাটফর্মই কোনো আঞ্চলিক ভাষায় ইন্টারফেস সাপোর্ট দেয় না, এবং এমনকি হিন্দি ও বাংলার মত মুখ্য দক্ষিণ-এশীয় ভাষাগুলি, যাতে কোটি কোটি মানুষ কথা বলেন, -সেগুলিও তুলনায় অনেক কম সাপোর্টেড।
  • যারা দক্ষিণ-পূর্ব এশীয় ভাষাগুলিতে কথা বলছেন: দক্ষিণ-পূর্ব এশীয় ভাষাগুলির সাপোর্ট একইরকমভাবে মিশ্র। যেখানে আমাদের জরিপ অনুযায়ী ইন্দোনেশীয়, ভিয়েতনামিজ এবং থাই ভাষার ক্ষেত্রে ভালোভাবে সাপোর্টের এই প্রবণতা অনেক বেশি। অন্য অধিকাংশ দক্ষিণ-পূর্ব এশীয় ভাষাগুলি আমাদের জরিপ করা অধিকাংশ প্ল্যাটফর্মই সাপোর্ট করে না।

এইসমস্ত অঞ্চলে যারা বসবাস করেন, তাদের দৈনন্দিন বাস্তবতার সাপেক্ষে মার্টিন ও মার্কের গবেষণালব্ধ ফলগুলি আরো তাৎপর্যপূর্ণ হয়ে ওঠে। উদাহরণস্বরূপ, মালাউই -এর ডোনাল্ড যখন চিন্দালি নামের একটি বিপন্ন বান্টু ভাষা ব্যবহারকারীদের জিজ্ঞাসা করেছেন কীভাবে তারা ফোনের মাধ্যমে যোগাযোগ করেন? উত্তরে তিনি জানতে পেরেছেন যে এই কাজটি চিন্দালিতে কতটা সময়সাপেক্ষ এবং পরিশ্রমসাধ্য, কারণ তাদের বেশিরভাগ ফোনই ইংরেজি, ফরাসি বা আরবি ভাষা সাপোর্ট করে, তাই সেগুলির ইন্টারফেস চিন্দালি ভাষাকে চিনতে পারেনি। অর্থনৈতিক ও সামাজিক বাধ্যবাধকতার পাশাপাশি অতি অবশ্যই এইসমস্ত প্রযুক্তিগত প্রতিবন্ধকতা চিন্দালিভাষীদের স্মার্টফোন বা ডেটা প্ল্যান কেনার ক্ষমতাকে সীমিত করে। এমনকি যারা মালাউই-এর জাতীয় ভাষা চিচেওয়া ব্যবহার করেন, ভাষা সাপোর্টের অভাব তাদের পক্ষে বড় বাধা হয়ে দাঁড়ায়: “আমি কেন একটা দামী ফোন কিনব, বা সময় নষ্ট করে ইন্টারনেট ঘাঁটতে যাব, যেখানে ভাষাটা ইংরেজি, এবং আমি সেটা বুঝি না?” কার্যত, অধিকাংশ আফ্রিকান ভাষার ক্ষেত্রে ভাষা সাপোর্টের অভাব তীব্রভাবে লক্ষ্য করা গিয়েছিল ২০১৮ সালে, যখন ট্যুইটার প্রথম স্বীকৃতি দেয় সোয়াহিলিকে, এমন একটি ভাষা যেটিতে পূর্ব আফ্রিকা ও তার বাইরেও ৫-১৫ কোটি মানুষ কথা বলেন (প্রথম বা দ্বিতীয় ভাষা হিসেবে)। এর আগে অবধি সোয়াহিলি এবং অন্য অধিকাংশ আফ্রিকান ভাষাকে এই প্ল্যাটফর্মে ইন্দোনেশিয়ান হিসাবে উল্লেখ করা হত। সোয়াহিলি শব্দের এই স্বীকৃতি ও এর অনুবাদ প্রচেষ্টা কিন্তু এই টেক কোম্পানিটির দ্বারা শুরু হয়নি; প্রকৃতপক্ষে এটা ছিল সোয়াহিলিভাষী ট্যুইটার ব্যবহারকারীদের একটি প্রচার-আন্দোলনের ফল। লাতিন আমেরিকাতেও আদিবাসী ভাষাগুলির পরিস্থিতি খুব একটা ভালো নয়।

কিমেলটুয়ে প্রকল্প মাপুজুগুন ভাষার ওপর কাজ করছে, বর্তমান চিলি ও আর্জেন্টিনার মাপুচে জনগোষ্ঠী এই ভাষায় কথা বলে। এই প্রকল্পের সঙ্গে একটি সাক্ষাৎকারে তারা জানিয়েছেন “ফেসবুক বা ইউটিউবের মত প্ল্যাটফর্মে মাপুজুগুনে কিছু পোস্ট করতে পারলে চমৎকার হবে। ইন্টারফেস অনুবাদও নয়, শুধুমাত্র ট্যাগ করতে পারা, যে-সমস্ত মেনু থাকে সেগুলো মাপুজুগুন ভাষায় হলেই হবে। উদাহরণস্বরূপ, ফেসবুক বা ইউটিউবে কোনো ভিডিও আপলোড করার সময় আপনি মাপুজুগুনে কোনো ট্রান্সক্রিপ্ট যোগ করতে পারবেন না, কারণ পূর্বনির্ধারিত ভাষার তালিকায় এটি নেই। ফলে আপনি যদি মাপুজুগুনে কোনো বর্ণনা দিতে চান, তাহলে অতি অবশ্যই আপনাকে বলতে হবে যে এটি স্প্যানিশ বা ইংরেজিতে।”

মার্টিন ও মার্ক নির্দিষ্ট ডিভাইস, যেমন মোবাইল ফোন ধরে ধরে ভাষা সাপোর্ট বিশ্লেষণ করেননি। কিন্তু আমরা জানি যে ডিজিটাল কীবোর্ডগুলি হল এমন কয়েকটি গুরুত্বপূর্ণ স্পেসের অন্যতম, যে জায়গাগুলিতে ভাষাবিদ ও প্রযুক্তিবিদরা সবচেয়ে বেশি উন্নতি করেছেন। উদাহরণস্বরূপ, জি-বোর্ড, অ্যান্ড্রয়েড পরিচালিত স্মার্টফোনের জন্য গুগলের কীবোর্ড ৯০০-এরও বেশি ধরনের ভাষা সাপোর্ট করে, এবং এটি বিভিন্ন ভাষা সম্প্রদায় ও গবেষকদের সঙ্গে উল্লেখযোগ্য কাজের ভিত্তিতে তৈরী। এখনও আমরা এইসমস্ত ক্ষমতাসম্পন্ন স্মার্টফোনের কীবোর্ড ব্যবহার করতে পারি, যদি তুলনামূলকভাবে দামী স্মার্টফোন কেনার ক্ষমতা থাকে, তবেই।

একইসঙ্গে, সিংহলির ক্ষেত্রে উদা-র অভিজ্ঞতা প্রথম অথবা দ্বিতীয় ভাষা হিসেবে যে ভাষায় শ্রীলঙ্কার ২কোটিরও বেশি মানুষ কথা বলেন —দেখায় যে ভাষা সাপোর্ট নিয়ে কাজ করা প্রযুক্তিবিদরা যদি সহজে ভাষাটি বুঝতে না পারেন, তবে সেই ভাষায় কন্টেন্ট তৈরী করা এখনও বেশ কঠিন। বিশেষতঃ, তা যদি পশ্চিম ইউরোপীয় ভাষাগুলির ল্যাটিন লিপি থেকে অনেকটা আলাদা হয়। তিনি বলেন “ইউনিকোড সিংহলীর মূল সমস্যা হল বিভিন্ন হরফ একসাথে করে একটি অক্ষর তৈরি করার যে ক্রম, সেটিতে। এতে করে ব্যঞ্জনবর্ণের পরে বৈশিষ্ট্যসূচক চিহ্ন যোগ করতে হয়। -এই চিন্তাধারা ইউরোপীয় ভাষার নিয়ম অনুসারী, যা ল্যাটিন লিপির উপর ভিত্তি করে গঠিত। কিন্তু সিংহলীতে কখনও কখনও বৈশিষ্ট্যসূচক চিহ্ন ব্যঞ্জনবর্ণের আগে আসে।” ইউনিকোড হল কোনো ভাষার লিখনপদ্ধতি বা লিপির টেক্সট কোডিংয়ের প্রযুক্তিগত মানদন্ড। এর ১৩-তম সংস্করণে ১৪৩,৮৫৯ টি অক্ষর আছে। যা বর্তমানে ৩০-টিরও বেশি ধরনের লিখনপদ্ধতিতে ব্যবহৃত হয়, কারণ একই লিখনপদ্ধতি একাধিক ভাষার ক্ষেত্রে ব্যবহার করা যেতে পারে (উদাহরণস্বরূপ, অধিকাংশ পশ্চিম ইউরোপীয় ভাষাগুলির ক্ষেত্রে ল্যাটিন লিপি; চীনা, জাপানি ও কোরিয়ান ভাষাগুলির জন্য হান লিপি; এবং বিভিন্ন দক্ষিণ এশীয় ভাষাগুলির জন্য দেবনাগরী লিপি)। এতে এমনকি ঐতিহাসিক ভাষা-লিপি —যেগুলি আর ব্যবহার হয় না, সেগুলির জন্যও অক্ষর আছে। ইউনিকোড কনসর্টিয়াম (ক্যালিফোর্নিয়া ভিত্তিক একটি অলাভজনক সংস্থা) এছাড়াও ইমোজি নিয়ে কাজ করে, যে প্রতীকগুলি আমরা বিভিন্ন ইন্টারফেসের মাধ্যমে প্রতিদিন ব্যবহার করি।

ভাষা সাপোর্ট বিষয়ক মার্টিন ও মার্কের সমীক্ষা এবং বিশ্বের নানা প্রান্তের অন্য কন্ট্রিবিউটারদের অভিজ্ঞতা –সব মিলিয়ে এই সংক্ষিপ্ত বিবরণে এই মুহুর্তে বিভিন্ন অ্যাপ ও প্ল্যাটফর্মে অধিকাংশ ভাষার ক্ষেত্রে সীমিত ও অসম প্রযুক্তিগত সহায়তার আরো বিশদ বিবরণ ফুটে উঠেছে। এগুলি অবশ্যই পড়ুন।

ভাষার কন্টেন্ট: অ্যাকসেসিবিলিটি ও উৎপাদন

«বিশেষ করে নারীবাদী কন্টেন্ট স্থানীয় ভাষায় মেলে না। উইমেন্স ডেভেলপমেন্ট ফাউন্ডেশন হল গ্রামীণ মহিলাদের একটি দল যারা ১৯৮৩ সাল থেকে মেয়েদের অধিকার সংক্রান্ত বিষয়গুলি নিয়ে কাজ করে আসছে। কিন্তু ২০১৯ সালে এসে তবেই আমরা সিংহলী ভাষায় সামাজিক-রাজনৈতিক ও অর্থনৈতিক বিষয়গুলির ওপর নারীবাদী বিষয়বস্তু অনলাইনে ভাগ করে নিতে শুরু করেছি।»

«দুর্ভাগ্যবশতঃ আগেও, এবং এখনও ইন্টারনেটে বাহাসা ইন্দোনেশিয়া -ভাষায় সদর্থক ও শিক্ষামূলক ক্যুইয়ার কন্টেন্ট খুঁজে পাওয়া বেশ কঠিন... আমরা যদি সর্ববৃহৎ এবং সবচেয়ে জনপ্রিয় সার্চ ইঞ্জিন গুগল-এ “এলজিবিটি” বা “হোমোসেকসুয়ালিটাস”(সমকামিতা) খুঁজতে যাই--তাহলে “ পেনইমপাঙ্গান” (বিচ্যুতি), “দোষা” (পাপ), এবং “পেনিয়াকিট” (রোগ) -শব্দগুলি সম্বলিত অজস্র ফলাফল পাব।»

«বাংলা ভাষায় ইন্টারনেটে ক্যুইয়ার ও প্রতিবন্ধকতা সম্পর্কিত যে সমস্ত তথ্য পাওয়া যায় (অথবা এমনকি এর অনুপস্থিতি) —তা একদিকে যেমন অনেকাংশেই হোমোফোবিয়া (সমকামিতার প্রতি বিদ্বেষ ও ঘৃণা) ও এবলিজমের ফল, আবার অন্যদিকে এর কারণও বটে।»

আমরা যখন অনলাইন হই, তখন বিশ্বের কোন্ অংশের ও কাদের জ্ঞানের সঙ্গে আমাদের পরিচয় ঘটছে -তা বিশ্লেষণের মধ্য দিয়ে ইন্টারনেটের কনটেন্টকে আমরা বুঝতে চেয়েছি। কারণ, মোটের ওপর সমস্ত ওয়েবসাইটের ৬৩%-এর বেশি তাদের কন্টেন্টের প্রাথমিক ভাষা হিসেবে ইংরেজি ব্যবহার করে।

আমাদের কন্ট্রিবিউটররা তাদের প্রবন্ধে ও সাক্ষাৎকারে তাদের ভাষায় অর্থপূর্ণভাবে ইন্টারনেট ব্যবহার করার ক্ষেত্রে কী কী ঐতিহাসিক, সামাজিক-রাজনৈতিক, অর্থনৈতিক ও প্রযুক্তিগত বাধার সম্মুখীন হতে হয় সেসব নিয়ে আলোচনা করেছেন। সবচেয়ে তাৎপর্যপূর্ণ হল, তারা সকলেই ইন্টারনেটে তাদের নিজেদের ভাষায় প্রাসঙ্গিক বিষয়গুলি খুঁজে পাওয়া, ও এই ভাষাগুলিতে অর্থপূর্ণ কন্টেন্ট তৈরী করার যে সমস্যা, তা নিয়ে আলোচনা করেছেন। অন্যভাবে বলতে গেলে, যারা আমাদের অভিজ্ঞতা বা প্রেক্ষাপট বুঝতে অক্ষম, বা এমনকি যারা বিরূপ মনোভাব পোষণও করতে পারেন, আমাদের জন্য সম্পূর্ণ অন্য ভাষায় তাদের হাতে তৈরী তথ্য ও জ্ঞানসম্ভার ব্যবহার করতে পারা আমাদের পক্ষে যথেষ্ট নয়। আমাদের নিজেদের, এবং আমাদের সম্প্রদায়ের জন্য প্রয়োজনীয় অর্থপূর্ণ কনটেন্ট আমাদেরকেই তৈরী করতে হবে। অথবা, বিভিন্ন ভাষায় এগুলির উৎপাদন ও সম্প্রসারণকে আমরা যেন অন্ততঃ সমর্থনটুকু করতে পারি।

এটি বিশেষ করে তাদের পক্ষে জরুরি, যাদের অ্যাকসেসিবিলিটির সমস্যা রয়েছে এবং যারা প্রান্তিকীকরণ ও বহিষ্করণের বিভিন্ন রূপ উপর্যুপরি অনুভব করেন।

যেমনটা জোয়েল তার ইন্ডিজেমোজি প্রকল্প নিয়ে সাক্ষাৎকারে আমাদের জানিয়েছেন, এটা শুরু হয়েছিল তার একটা হতাশ টুইট থেকে, যেখানে একদিন তিনি রাস্তার পাশে গাড়ি থামিয়ে বিভিন্ন ইমোজির পাশে পাশে আর্রেন্টে শব্দে সেগুলির অর্থ লিখতে শুরু করেছিলেন। ইন্টারনেটে ইমোজিগুলি প্রথম ব্যবহৃত হতে শুরু হওয়ার কয়েক দশক পরেও আর্রেন্টের মত আদিবাসী ভাষাগোষ্ঠীগুলির চাহিদামতো তাদের মৌখিক এবং দৃশ্য-ভাষা ব্যবহারের আর্জি মানা হয়নি। যেমনটা আমরা আগে বলেছি, ইউনিকোড কনসোর্টিয়াম নতুন ইমোজির জন্য জনসাধারণের অনুরোধ বিবেচনা করে, কিন্তু অস্ট্রেলিয়ার মূলনিবাসীদের পতাকার জন্য একটি ইমোজির মত আবেদনগুলি প্রত্যাখ্যাত হয়। জোয়েল, ক্যাডি এবং অন্যান্যদের ক্ষেত্রে ইন্ডিজেমোজি প্রকল্প এইধরনের বহুবিধ শারীরিক ও ভার্চুয়াল প্রান্তিকতাকে ঠেলে সরিয়ে দেওয়ার একটি বহু-প্রজন্মের উদ্যোগে পরিণত হয়েছে। পাশাপাশি, এই প্রকল্প তাদের আদি জাতিপরিচয় ও ভাষার জন্য অর্থবহ-এমনভাবে নিজস্ব কন্টেট তৈরী করারও একটি উদ্যোগ।

অনেকগুলি ইমোজির তালিকা সমন্বিত একটি টুইট, যেখানে পাশাপাশি আর্রেন্টে শব্দগুলি দেওয়া আছে৷ উৎস:
অনেকগুলি ইমোজির তালিকা সমন্বিত একটি টুইট, যেখানে পাশাপাশি আর্রেন্টে শব্দগুলি দেওয়া আছে৷ উৎস: Indigemoji.

এটা মনে রাখা দরকার যে আদিবাসী ভাষাগুলি আজকের দিনে বিশ্বে “সংখ্যালঘু” ভাষা, এর পিছনে রয়েছে ঔপনিবেশিকতার মধ্য দিয়ে গণহত্যার ইতিহাস, যেখানে আদি জনগোষ্ঠীগুলিকে হয় ধ্বংস করে দেওয়া হয়েছে, নাহয় কোনো দেশ বা অঞ্চলের প্রাথমিক বাসিন্দা হওয়া সত্ত্বেও তারা সংখ্যালঘু জনগোষ্ঠীতে পরিণত হয়েছে। এবং এই ঔপনিবেশিকরণ প্রক্রিয়ার অভিঘাত লক্ষ লক্ষ মানুষ কথা বলেন -এমন প্রভাবশালী ভাষাগুলির ওপরেও পড়েছে।

ঈশান একজন দৃষ্টিশক্তিহীন ক্যুইয়ার অ্যাকাডেমিক, যার পক্ষে অনলাইন হওয়াটাই সমস্ত প্রতিকূলতার বিরুদ্ধে একটি প্রচেষ্টা। এরপর বাংলায় প্রতিবন্ধকতা, সমকামিতা এবং তদুপরি এ-দুয়ের ইন্টারসেকশন নিয়ে প্রাসঙ্গিক তথ্য খুঁজে পেতে তাকে রীতিমতো লড়াই করতে হয়। একে তিনি বলছেন ‘প্রান্তিকতার মধ্যে প্রান্তিকতা’: “একদিকে সমাজের হোমোফোবিক ও এবলিস্ট আচরণ, এবং অন্যদিকে ব্যক্তির (ক্যুইয়ার এবং/অথবা প্রতিবন্ধী) অন্তর্নিহিত হোমোফোবিয়া ও এবলিজম -এই দুটিই একে অপরের পরিপূরক এবং একত্রেই তারা প্রান্তিকীকরণের প্রক্রিয়াটিকে ত্বরান্বিত করে। সমাজে একজন ক্যুইয়ার প্রতিবন্ধী মানুষের অবস্থানটিকে ‘প্রান্তিকতার মধ্যে প্রান্তিকতা’ শব্দবন্ধটির দ্বারা বর্ণনা করা যেতে পারে।”

অন্য ভাষায় বলতে গেলে, ইন্টারনেটে পর্যাপ্ত তথ্য ও অ্যাকসেসের প্রক্রিয়াটি বাংলার মত একটি প্রভাবশালী ভাষাতেও অনুপস্থিত, যে ভাষায় বিশ্বের প্রায় ৩০ কোটি মানুষ কথা বলেন।

মার্টিন ও মার্ক দুটি ভিন্ন ধরণের তথ্য ও জ্ঞানের প্ল্যাটফর্মকে বেছে নিয়ে সেখানে বিভিন্ন ভাষায় কন্টেন্টের ধরণ ও পরিমাণ বিশ্লেষণ করার জন্য আরও গভীরে যেতে চেয়েছেন। -এই প্ল্যাটফর্ম দুটি হল গুগল মানচিত্র এবং উইকিপিডিয়া।

গুগল মানচিত্র

আমরা কি আমাদের অসংখ্য ভিন্ন ভিন্ন ভাষায় গুগল ম্যাপ ব্যবহার করতে পারি? গুগল মানচিত্রে বিশ্বের যে রূপ আমরা দেখি, আমাদের ব্যবহৃত ভাষা কি তাকে বদলে দেয়?

এই প্রশ্নগুলির উত্তর দিতে গিয়ে মার্টিন ও মার্ক গুগল ম্যাপ-এর গ্লোবাল কনটেন্ট কভারেজের তথ্য সংগ্রহ করেছেন ১০টি সর্বাধিক কথিত ভাষায়: ইংরেজি, ম্যান্ডারিন-চীনা, হিন্দি, স্পেনীয়, ফরাসি, আরবি, বাংলা, রাশিয়ান, পর্তুগিজ এবং ইন্দোনেশীয় (বাহাসা ইন্দোনেশিয়া)। তারা পৃথক পৃথক ভাবে এই ভাষাগুলিতে কয়েক কোটি অনুসন্ধানের ফলাফল সংগ্রহ করেছেন, এবং এর মধ্যে তিরিশ লক্ষ অদ্বিতীয় স্থান (বিভিন্ন স্থান ও অন্যান্য ক্ষেত্র) চিহ্নিত করেছেন, এবং সেগুলির মানচিত্র প্রস্তুত করেছেন।

এতে অবাক হওয়ার কিছু নেই যে, ম্যাপগুলিতে তখনই সবচেয়ে বেশি কনটেন্ট থাকে, যখন আমরা গুগল ম্যাপ ইংরেজিতে ব্যবহার করি। গুগলের ইংরেজি ভাষার মানচিত্র সমগ্র বিশ্বকে কভার করে, যদিও, গ্লোবাল নর্থে এটি অনেক বেশি ঘন (অর্থাৎ, এখানে অনেক বেশি তথ্য আছে), যার কেন্দ্রে আছে ইউরোপ ও উত্তর আমেরিকা। একইসঙ্গে, এটি দক্ষিণ এশিয়া এবং দক্ষিণ-পূর্ব এশিয়ার কিছু অংশ, ও সেইসঙ্গে লাতিন আমেরিকার একটা বড় অংশকেও তুলনামূলক ভালোভাবে কভার করে। যদিও, তুলনায় আফ্রিকার বহু অংশে কনটেন্ট অনেক কম।

ইংরেজিভাষীদের জন্য গুগল মানচিত্রে তথ্যের ঘনত্ব। গাঢ় রং সেইসব জায়গা নির্দেশ করে, যেখানে অনুসন্ধানের ফলাফলের মধ্যে অনেক বেশি জায়গা অন্তর্ভুক্ত রয়েছে। [PDF↓]

আমরা দেখেছি, অনেকটা জায়গা জুড়ে ভালোভাবে ছড়িয়ে থাকা ইংরেজি মানচিত্রের তুলনায় বাংলা (যা ঈশান-এর প্রথম ভাষা) সম্পূর্ণ বিপরীত মেরুতে অবস্থান করছে। এটি মূলতঃ দক্ষিণ এশিয়ায়, বিশেষ করে ভারত ও বাংলাদেশ জুড়ে রয়েছে। বিশ্বের বাকি অংশের বাংলাভাষী মানুষদের জন্য গুগল ম্যাপে অতি সামান্য কিছু, বা একেবারেই কোনো কনটেন্ট নেই বলা যায়। অতিরিক্ত কনটেন্ট খুঁজে পেতে, এবং ভারত-বাংলাদেশের বাইরে অন্যান্য দেশগুলিতে চলাফেরার ক্ষেত্রে বাংলাভাষীদের ইংরেজির মত কোনো দ্বিতীয় ভাষাকে বেছে নিতে হয়। হিন্দি (যা ইংরেজি ও ম্যান্ডারিন-চীনা ভাষার পর বিশ্বে তৃতীয় সর্বাধিক ব্যবহৃত ভাষা) গুগল ম্যাপের ক্ষেত্রেও একথা প্রযোজ্য।

বাংলাভাষীদের জন্য গুগল মানচিত্রে তথ্যের ঘনত্ব। গাঢ় রং সেইসব জায়গা নির্দেশ করে, যেখানে অনুসন্ধানের ফলাফলের মধ্যে অনেক বেশি জায়গা অন্তর্ভুক্ত রয়েছে। [PDF↓]

মার্টিন ও মার্কের বিস্তারিত প্রবন্ধে বিভিন্ন ভাষায় গুগল মানচিত্র নিয়ে আরো অনেক কিছু রয়েছে।

উইকিপিডিয়া

মার্টিন ও মার্কের প্ল্যাটফর্ম সমীক্ষা অনুযায়ী, ইন্টারনেটে ভাষা-সাপোর্টের ক্ষেত্রে উইকিপিডিয়া সবচেয়ে এগিয়ে আছে। এতে গুগল ও ফেসবুক সহ যে-কোনো বাণিজ্যিক প্ল্যাটফর্মের চেয়ে অনেক বেশি ভাষায় অনূদিত ব্যবহারকারী ইন্টারফেস রয়েছে।

উইকিপিডিয়ার নিবন্ধগুলিতে জ্ঞান ও তথ্যের প্রকৃত কনটেন্টের হিসেবে, ৩০০-রও বেশি ভাষায় এর সংস্করণ রয়েছে। কিন্তু তবুও, এই ভাষাগুলিতে কথা বলা প্রত্যেকে একই কনটেন্ট বা একই পরিমাণ তথ্য পায় না। আমরা আরও গভীরে গিয়ে প্রশ্ন করতে ও উত্তর পেতে চেয়েছি যে, উইকিপিডিয়ার বিভিন্ন ভাষার সংস্করণ জুড়ে কনটেন্টের ব্যাপ্তি কেমন? এক্ষেত্রে কিছু ভাষা কি বাকি ভাষাগুলির তুলনায় বেশি সুবিধাজনক অবস্থানে রয়েছে? নির্দিষ্ট কিছু ভাষাগোষ্ঠী কি বাকিদের তুলনায় অনেক বেশি কনটেন্ট পেয়ে থাকে? আমরা মার্টিন ও মার্কের উইকিপিডিয়া বিশ্লেষণ–এ এইরকমই কিছু প্রশ্নের উত্তর বিশদে দিয়েছি।

আমরা ২০১৮-র তথ্য ব্যবহার করেছি জিওট্যাগ (উইকিপিডিয়া নিবন্ধগুলির মধ্যে ভৌগোলিক রেফারেন্স, যেমন- স্থানাঙ্ক -বসানোর একটি পদ্ধতি ) সহ, এবং বিভিন্ন ভাষায় নিবন্ধের সংখ্যা ও কন্টেন্টের বৃদ্ধি বিশ্লেষণ করেছি। এছাড়াও, আমরা যে “আঞ্চলিক” ভাষাগুলির ওপর ভিত্তি করে আমাদের বিশ্লেষণপ্রক্রিয়া চালিয়েছি, সেগুলি হয় ইউনিকোড CLDR (যে কোডটি ইন্টারনেটে ভাষাগুলিকে সাপোর্ট করে) -এ দাপ্তরিক ভাষার শ্রেণীভুক্ত, নাহয় কোনো দেশের অন্ততঃ ৩০ শতাংশ জনগণ ভাষাটি ব্যবহার করেন।

এরপরে আমরা সবচেয়ে অধিক ব্যবহৃত আঞ্চলিক ভাষাকে চিহ্নিত করেছি, অর্থাৎ, প্রতিটি দেশে সবচেয়ে বেশি মানুষ কথা বলেন যে-ভাষায়। আমরা এমন ৭৩-টি ভাষা খুঁজে পেয়েছি, যেগুলি অন্ততঃ একটি দেশে সবচেয়ে বেশি ব্যবহৃত। এদের মধ্যে ইংরেজি সর্বাধিক কথিত ভাষা, এবং ৩৪-টি দেশের সবচাইতে প্রভাবশালী ভাষা। এর পরে আছে আরবি ও স্পেনীয় (১৮-টি দেশ), ফরাসি (১৩-টি দেশ), পর্তুগিজ (সাতটি দেশ), জার্মান (চারটি দেশ), এবং ডাচ (তিনটি দেশ)। চীনা, ইতালীয়, মালয়, রোমানিয়ান, গ্রীক ও রাশিয়ান -দুটি করে দেশের, এবং বাদবাকি ৬০-টি ভাষা একটি করে দেশের সবচেয়ে বেশি ব্যবহৃত ভাষা।

প্রতিটি দেশের উইকিপিডিয়া কনটেন্টের সঙ্গে এই আঞ্চলিক ভাষাগুলির বন্টনের তুলনা করার জন্য আমরা সেই দেশ সম্পর্কিত সবচেয়ে বেশি সংখ্যক নিবন্ধের উইকিপিডিয়া ভাষা সংস্করণগুলিকে চিহ্নিত করেছি। সেখানে আমরা ইংরেজি ভাষার কনটেন্টের প্রতি পক্ষপাত খুঁজে পেয়েছি। ইংরেজি ৯৮-টি দেশের প্রভাবশালী উইকিপিডিয়া ভাষা। এরপর আছে ফরাসি (নয়টি দেশ), জার্মান (আটটি দেশ), স্পেনীয় (সাতটি দেশ), ক্যাটালান এবং রাশিয়ান (চারটি দেশ), ইতালীয় ও সার্বিয়ান (তিনটি দেশ), এবং ডাচ, গ্রীক, আরবি, সার্বো-ক্রোয়েশিয়ান, সুইডিশ ও রোমানিয়ান (দু'টি দেশ)। বাকি ২১-টি উইকিপিডিয়া ভাষা একটি করে দেশের ক্ষেত্রে সর্বাধিক প্রভাবশালী।

যেখানে প্রতিটি ভাষায় উইকিপিডিয়ার নিবন্ধের সংখ্যা বেড়েই চলেছে, সেখানে এটা স্পষ্ট যে, উইকিপিডিয়ার ভাষা-সংস্করণ আকারে ও আয়তনে অনেকখানি পরিবর্তিত হয়ে থাকে -নিবন্ধের সংখ্যা এবং সম্পাদকগোষ্ঠীগুলির আয়তন এ-দুয়ের নিরিখেই। ইংরেজি উইকিপিডিয়া এখনও পর্যন্ত বৃহত্তম, এতে ষাট লক্ষেরও বেশি নিবন্ধ এবং প্রায় চার কোটি নথিভুক্ত কন্ট্রিবিউটর রয়েছেন। পরবর্তী বৃহত্তম কন্ট্রিবিউটর গোষ্ঠী রয়েছে স্পেনীয়, জার্মান এবং ফরাসি উইকিপিডিয়া সংস্করণগুলিতে -এগুলির প্রত্যেকটিতে কন্ট্রিবিউটরের সংখ্যা চল্লিশ থেকে ষাট লক্ষের মধ্যে, এবং নিবন্ধ রয়েছে কুড়ি লক্ষের কাছাকাছি। বাকি ভাষা সংস্করণগুলি তুলনামূলকভাবে ক্ষুদ্রায়তন। কেবলমাত্র ২০-টির মতো ভাষা-সংস্করণে দশ লক্ষের বেশি নিবন্ধ রয়েছে, আর শুধুমাত্র ৭০-টিতে রয়েছে এক লক্ষের বেশি নিবন্ধ। উইকিপিডিয়ার অধিকাংশ ভাষা সংস্করণেই ইংরেজি উইকিপিডিয়ার কন্টেন্টের সামান্য কিছু অংশ থাকে।

২০১৮ সালের গোড়ার দিকে ইংরেজি উইকিপিডিয়ার তথ্যের ঘনত্ব। গাঢ় রঙ জিওট্যাগ করা নিবন্ধগুলির একটা বড় সংখ্যাকে নির্দেশ করে। [PDF↓]
২০১৮ সালের গোড়ার দিকে আরবি, বাংলা, হিন্দি ও স্পেনীয় উইকিপিডিয়াগুলির তথ্যের ঘনত্ব। গাঢ় রঙ অনেক বেশি সংখ্যক জিওট্যাগ করা নিবন্ধকে নির্দেশ করে। [PDF↓]

আকর্ষণীয় বিষয় হল, গুগল মানচিত্রে ভাষাবন্টনের যে অসাম্য আমরা এর আগে দেখেছি, উইকিপিডিয়া জুড়েও সেই একই বিষয়ের পুনরাবৃত্তি দেখতে পাই। এটি এক্ষেত্রেও সত্য যে, যখন আমরা বিভিন্ন ভাষায় (প্রথম ও দ্বিতীয়, উভয় ভাষা হিসেবেই) কথা বলা মানুষের সংখ্যার সঙ্গে সেই ভাষায় উইকিপিডিয়ার নিবন্ধের সংখ্যা তুলনা করি, তখন দেখতে পাই ইংরেজি, ফরাসি, স্পেনীয়, রাশিয়ান ও পর্তুগিজের মত ইউরোপীয় ভাষায় উইকিপিডিয়ার নিবন্ধের সংখ্যা সেই ভাষায় কথা বলা মানুষের সংখ্যার সমানুপাতিক। কিন্তু বাকি বহুল কথিত ভাষাগুলির ক্ষেত্রে এটি সত্য নয়। ম্যান্ডারিন চীনা, হিন্দি, আরবি, বাংলা এবং ইন্দোনেশীয় (বাহাসা ইন্দোনেশিয়া) ভাষাগুলির প্রত্যেকটিতে কোটি কোটি মানুষ কথা বলেন, তবুও তাদের ভাষাগুলিতে উইকিপিডিয়া ক্ষুদ্রায়তন, ইউরোপীয় ভাষাগুলির তুলনায় নিবন্ধের সংখ্যা অনেক কম। উইকিপিডিয়ার চীনা, হিন্দি বা আরবি সংস্করণের তুলনায় ফরাসি, স্পেনীয় বা পর্তুগিজ সংস্করণে সংখ্যায় অনেক বেশি নিবন্ধ রয়েছে, যদিও পূর্বোক্ত ভাষাগুলি বিশ্বের শীর্ষ পাঁচটি কথিত ভাষা-র অন্তর্ভুক্ত, ফরাসি এবং পর্তুগিজের চেয়েও এই ভাষাগুলিতে অনেক বেশি সংখ্যক মানুষ কথা বলেন।

বিশ্বের ১০-টি বহুল কথিত ভাষায় উইকিপিডিয়া কন্টেন্ট ও এই ভাষাগুলিতে কথা বলা মানুষের সংখ্যা। (জনসংখ্যার আনুমানিক হিসেব: এথনোলগ ২০১৯, দ্বিতীয়-ভাষার বক্তারাও এর অন্তর্ভুক্ত) [PDF↓]

মার্টিন ও মার্কের প্রবন্ধ-তে বিভিন্ন ভাষায় উইকিপিডিয়া নিয়ে অনেক বেশি বিশ্লেষণ ও ডেটা ভিজুয়ালাইজেশন আছে। কিন্তু এই পরিসংখ্যানগুলি থেকে একথা স্পষ্ট যে এগুলি বিশ্বজুড়ে আমাদের কন্ট্রিবিউটরদের বাস্তব অভিজ্ঞতারই প্রতিধ্বনি।

যে ভাষাগুলি প্রাথমিকভাবে ইউরোপীয় ঔপনিবেশিক ভাষা নয়, সেগুলির প্রান্তিকীকরণ ও বহিষ্করণ অফলাইন এবং অনলাইন জগতের গভীরে রয়েছে। আরবির মত একটি প্রভাবশালী ও বৈশ্বিক ভাষাও এর অন্তর্ভুক্ত। কারো নিজের ভাষায় উইকিপিডিয়া লিখতে গেলে সেই ভাষার অনুষঙ্গের উপর ভিত্তি করে গড়ে ওঠা তথ্যনির্দেশ ব্যবহার করতে, আমাদের বিস্তৃত ও নির্ভরযোগ্য প্রকাশিত সোর্স প্রয়োজন৷ যা (যেমনটা আমরা আগে পেয়েছি) বিশ্বের অধিকাংশ ভাষার ক্ষেত্রেই বিরল। একজন উইকিপিডিয়ান হিসাবে, এমনা আফ্রিকার বিভিন্ন ভাষায় রিসোর্স ও তথ্যনির্দেশ খুঁজে পাওয়া কতটা কষ্টকর সে সম্পর্কে কথা বলেছেন: “…যেমন, একজন উইকিপিডিয়ান হিসেবে আমার সংগ্রাম হল, আমাদের নিজেদের ভাষায় তথ্যনির্দেশ খুঁজে বার করা। আমি যখন বলছি, আমাদের নিজেদের ভাষা, তখন সেটা কেবলমাত্র তিউনিসিয়ান ভাষা, আমাদের উপভাষা বা আরবি ভাষা নয়, সমগ্র আফ্রিকা জুড়েই রিসোর্স ও তথ্যনির্দেশের ক্ষেত্রে আমরা একটি বিশাল ব্যবধান খুঁজে পাই।”

এমনকি ইউরোপেও, সংখ্যালঘু ভাষাভাষীরা তাদের নিজেদের ভাষায় উইকিপিডিয়া ব্যবহার বা সম্পাদন করতে রীতিমতো সংগ্রাম করেন৷ যখন ক্লডিয়া দেখেছেন যে ব্রেটনে তার উত্তরদাতাদের অনেকেই ব্রেটন উইকিপিডিয়ায় ব্যাপারে জানতেন, “এমনকি তাদের মধ্যে ১৯ শতাংশ মানুষ বিদ্যমান নিবন্ধগুলি সম্পাদনা বা নতুন নিবন্ধ লেখার(৮%) কাজেও যুক্ত ছিলেন,” তখন তার মনে হয়েছে যে বেশিরভাগ সংখ্যালঘু ভাষাভাষী মানুষ অন্য একটি প্রভাবশালী ভাষা বেছে নেবেন, কারণ তা সহজতর: “কোনো ভাষায় উপস্থিতি আছে মানে এই নয় যে সেই পরিষেবা, ইন্টারফেস, অ্যাপ এবং উইকিপিডিয়া আসলে ব্যবহৃত হয়। কিছু গবেষণায় দেখা গেছে যে সংখ্যালঘু ভাষাভাষীরা ভাষাভিত্তিক ডিজিটাল প্রযুক্তি ব্যবহারের সময় সহজেই তাদের প্রভাবশালী ভাষাটির দ্বারস্থ হচ্ছেন, কারণ, হয় সেই ভাষায় উপলব্ধ প্রযুক্তিগুলি সহজাতভাবেই উন্নত, নাহয় পরিষেবার পরিসর অনেক বিস্তৃত।”

উইকিপিডিয়া এবং এর বিনামূল্যের ও মুক্ত উৎস (যেখানে কোডগুলি সম্মিলিতভাবে তৈরি, এবং প্রকাশ্যে উপলব্ধ) জ্ঞানপ্রকল্পগুলি অনলাইনে বহুভাষিক জ্ঞানের সবচেয়ে আশাব্যঞ্জক ও সহায়ক স্পেসগুলির অন্যতম। উদাহরণস্বরূপ, এর স্বেচ্ছাসেবক গোষ্ঠীগুলি জানে ও বোঝে যে ইংরেজি, আরবি বা চীনা ভাষার কোনো একক রূপ নেই, কিন্তু ভাষা প্রসঙ্গ ও বিষয়বস্তুর এই বহুত্ব প্রকাশ করা সবসময় সহজ নয়। যেমনটা আমরা আমাদের অভিজ্ঞতা ও বিশ্লেষণ থেকে দেখেছি, ক্ষমতা এবং সুবিধার ঐতিহাসিক ও বহমান কাঠামো উইকিপিডিয়াকেও ভোগাচ্ছে, যা বিভিন্ন ভাষায়, সেইসঙ্গে ভাষাগোষ্ঠীগুলির মধ্যে জ্ঞান সৃষ্টি ও ভাগ করে নেওয়ার রূপ ও পদ্ধতিকে প্রভাবিত করে।

ব্যক্তি, সংস্থা এবং গোষ্ঠী হিসেবে আমরা, যারা আরো বহুভাষিক ইন্টারনেটের আশা করি, তাদের এগিয়ে যাওয়ার কয়েকটি উপায় কী? এই পরবর্তী ও চূড়ান্ত অংশে আমরা আপনাদের সঙ্গে ভাগ করে নেওয়া সমস্ত পরিসংখ্যানবর্ণনাগুলি থেকে উঠে আসা উপলব্ধি উপস্থাপন করেছি, যাতে আমরা কী শিখলাম, সেইসঙ্গে এর প্রসঙ্গ, বোধগম্যতা ও কাজকর্ম (যা আমাদের প্রকৃত অর্থে বহুভাষিক ইন্টারনেটের দিকে এগিয়ে নিয়ে যেতে পারে) সম্পর্কে সামগ্রিক একটা ধারণা দেওয়া যায়।

বহুভাষিক ইন্টারনেটের ব্যাপারে আমরা কী জানলাম?

এই প্রতিবেদনের কাজ করতে গিয়ে আমরা ভাষা, ইন্টারনেট এবং ইন্টারনেটের ভাষা -বিষয়ে অনেক কিছুই জেনেছি। এখনও পর্যন্ত আমাদের যাত্রাপথের সবচেয়ে গুরুত্বপূর্ণ উপলব্ধিগুলির একটি সংক্ষিপ্ত সামগ্রিক বিবরণ এখানে দেওয়া হল।

শিক্ষা: ভাষা জ্ঞানের প্রতিনিধি, এবং পৃথিবীতে হয়ে ওঠার একটি আবশ্যিক শর্ত, কেবলমাত্র যোগাযোগ স্থাপনের হাতিয়ার নয়। এই কারণেই বহুভাষিকতা এত গুরুত্বপূর্ণ, যাতে আমরা আরো ভালোভাবে নিজেদের বিভিন্ন সত্তার এবং আমাদের বিভিন্ন জগতের পরিপূর্ণ ঐশ্বর্য ও সন্নিবেশকে সম্মান ও নিশ্চিত করতে পারি।

প্রসঙ্গ: মানুষ ৭০০০-এরও বেশি ভাষায় নিজেদের জগৎকে চেনে, এবং নিজেদের প্রকাশ করে। আমাদের এই ভাষা মৌখিক (কথ্য ও সাঙ্কেতিক), লিখিত, বা ধ্বনির মাধ্যমেও প্রকাশিত হতে পারে। তবুও মূল টেক প্ল্যাটফর্ম এবং অ্যাপগুলিতে ভাষা সাপোর্ট এই ৭০০০ ভাষার সামান্যতম কিছু অংশের জন্য। এর মধ্যে অনলাইনে মাত্র ৫০০-টির মত ভাষা -তথ্য বা জ্ঞানের কোনো রূপের প্রতিনিধিত্ব করে। বিশ্বে বহুল কথিত ভাষাগুলির মধ্যে বেশ কিছু ভাষায় অনলাইনে তেমন তথ্য মেলে না, এগুলির ভাষা সাপোর্টও তেমন নেই। সবচেয়ে সমৃদ্ধ ভাষা সাপোর্ট, ইন্টারনেটে সবচেয়ে ব্যপক তথ্য (গুগল মানচিত্র ও উইকিপিডিয়া সহ), এবং অধিকাংশ ওয়েবসাইটই, ইংরেজিতে।

প্রতিফলন: ইন্টারনেটকে আমরা যতটা বহুভাষী মনে করি, বা যতটা বহুভাষী হওয়া দরকার, ইন্টারনেট তার ধারেকাছেও নেই।

বিশ্লেষণ: ইন্টারনেট ব্যবহার করতে গেলে অধিকাংশ মানুষকে তাদের নিকটতম ইউরোপীয় ঔপনিবেশিক ভাষা (ইংরেজি, স্পেনীয়, পর্তুগীজ, ফরাসি…) অথবা আঞ্চলিকভাবে প্রভাবশালী ভাষায় (চীনা, আরবি…) ব্যবহার করতে হবে। কোনো ভাষা অনলাইনে সহজে পাওয়া যাবে কি যাবে না -তার মূলে রয়েছে ক্ষমতা এবং সুবিধার ঐতিহাসিক ও বহমান কাঠামোটি।

কীভাবে আমরা আরো ভালো করতে পারি?: বহুভাষিক ইন্টারনেটের জন্য প্রেক্ষিত এবং কাজ

«অধিকাংশ ক্ষেত্রে, কোনো সংখ্যালঘু ভাষা ব্যবহার করার জন্য যথেষ্ট পরিমাণে অধ্যাবসায়, ইচ্ছাশক্তি, এবং সহনশীলতা প্রয়োজন। কেননা, সংখ্যালঘু ভাষা ব্যবহারের ক্ষেত্রে ব্যবহারকারীর অভিজ্ঞতা অসুবিধা ও ত্রুটিপূর্ণ।»

«কোনো বহুভাষী ইন্টারনেটের লক্ষ্য দেশীয় জনগোষ্ঠীর অন্তর্ভুক্তি ও প্রতিনিধিত্ব, যা অবশ্যই সামাজিক উত্তরাধিকার এবং ঔপনিবেশিক নিপীড়নের বহমান অভিজ্ঞতাকে হিসেবের মধ্যে রাখবে ও বিবেচনা করবে। কোনো বহুভাষী ইন্টারনেট শুধুমাত্র প্রতিনিধি হয়ে ওঠার কামনা করতে পারে না, বরং সেইসঙ্গে ঔপনিবেশিক ইতিহাসকে মাথায় রেখে অতি অবশ্যই পরিবেশকে এমনভাবে উন্নীত করবে, যাতে দেশীয় ভাষাগোষ্ঠীর মানুষদের জন্য, এবং তাদের দ্বারা —দেশীয় ভাষার টিঁকে থাকা ও ভাষাগুলি শিক্ষার পরিসর আরো বাড়ে।»

«ম্যাপুচে যুবা ও শিশুরা প্রযুক্তি এবং ইন্টারনেটের পাশাপাশি বেড়ে উঠছে। ইন্টারনেট এমন একটি জায়গা, যেখানে এই মানুষগুলি মাপুজুগুনের সান্নিধ্য পেতে পারে... আমাদের-মানুজনের কাহিনি লিখতে হবে, এবং সেগুলি মাপুজুগুন ভাষাতেই লেখা বা বলা দরকার... ঔপনিবেশিক এবং উত্তর-ঔপনিবেশিক রাষ্ট্রগুলি যেমন মহান বীরদের কীর্তি উদযাপন করে, আমাদের কাহিনি অপরিহার্যভাবে তা-নয়। আমাদের ইতিহাস হল প্রত্যেক মাপুচের কাহিনি, যারা বিদ্বেষ ও হিংসা থেকে বেঁচে ফিরতে পেরেছেন। যে মহিলাকে রুটিরুজির জন্য শহরে উঠে আসতে হয়েছে, যে নারী ও পুরুষেরা শহর থেকে ফিরেছিলেন, কিন্তু তাদের “লোফ”-এ আর কোনো ঘর ছিল না, ফলে তাদের শিকড় ছিঁড়ে আবার সেই শহরেই ফিরে যেতে হয়েছিল, ফিরে আসার আর কোনো জায়গা ছিল না৷ -প্রতিটি মাপুচের এইসমস্ত অভিজ্ঞতা ও স্মৃতিই জনগোষ্ঠী হিসেবে আমাদের সম্মিলিত চেতনার জন্ম দেয়।»

বিশ্বে এবং অনলাইনে বহুভাষিকতাকে কেন্দ্র করে থাকা বিভিন্ন প্রসঙ্গ, অসুবিধা এবং সুযোগগুলিকে বুঝতে -ইন্টারনেটের ভাষাপরিস্থিতি বিষয়ক সংক্ষিপ্ত প্রতিবেদনের এই অংশে আমরা আমাদের কন্ট্রিবিউটরদের, এবং আমাদের ২০১৯ সালের ২০১৯ সালে ইন্টারনেটের ভাষাগুলির ঔপনিবেশকতা-মুক্তকরণ আলোচনা -এর প্রতিবেদন থেকে বিভিন্ন উপলব্ধি একত্রিত করেছি। নিজেদেরকে এবং পরস্পরকে চারটি মূল প্রশ্ন জিজ্ঞাসা করলে হয়ত আরো বহুভাষী ইন্টারনেট গড়ে তোলার কল্পনা ও পরিকল্পনার পথনির্দেশ মিলবে।

  • ক্ষমতা ও রিসোর্স কার?
  • মূল্যবোধ এবং জ্ঞান কার?
  • প্রযুক্তি ও মাপকাঠি কার?
  • কল্পনা এবং নকশা কার?

ক্ষমতা ও রিসোর্স কার?

প্রসঙ্গ

আমাদের সংখ্যাতাত্ত্বিক বিশ্লেষণ এবং মানুষের জীবনযাপনের অভিজ্ঞতা -উভয়ই এটা স্পষ্ট করে যে, অফলাইন ও অনলাইন জগতে ভাষার প্রান্তিকীকরণ শুধুমাত্র কত সংখ্যক মানুষ সেই ভাষায় কথা বলছেন তার ওপর নির্ভরশীল নয়।

আদিবাসী ভাষাগুলিতে বিশ্বব্যাপী ৬০০০-এরও বেশি আদিবাসী জনগোষ্ঠী-এর মানুষ কথা বলেন, এরাই বিশ্বের অধিকাংশ জায়গার মূলনিবাসী ছিলেন। ঔপনিবেশিকরণ এবং গণহত্যা এদের জনসংখ্যা এবং ভাষাবৈচিত্র্য খর্ব করেছে। এশিয়া ও আফ্রিকার মত ভাষাতাত্ত্বিক দিক দিয়ে সবথেকে বৈচিত্র্যময় মহাদেশগুলিতে লক্ষ লক্ষ মানুষ যেসব সাঙ্কেতিক ও কথ্য ভাষা ব্যবহার করেন, সেই প্রভাবশালী ভাষাগুলি অনলাইনে তেমন উপস্থিত নয়, কখনো কখনো একেবারেই অনুপস্থিত। আমরা যদি বিভিন্ন দেশ ও মহাদেশ জুড়ে অভিবাসীদের কথ্য ভাষাগুলিকে ধরি, যেমন, বিভিন্ন ধরণের আরবি, চীনা, হিন্দি, বাংলা, পাঞ্জাবি, তামিল, উর্দু, ইন্দোনেশীয় (বাহাসা ইন্দোনেশিয়া), মালয়, সোয়াহিলি, হাউসা ইত্যাদি, তাহলে একথা স্পষ্ট হয় যে, এই ভাষাগুলি নিজেদের অঞ্চলে হয়তো অন্য ভাষার ওপর প্রভাব বিস্তার করতে পারে, কিন্তু অনলাইনে এগুলি প্রান্তিক ভাষা।

ডিজিটাল প্রান্তিকীকরণ ও বহিষ্করণের এই রূপগুলি আকষ্মিক নয়; এগুলি ক্ষমতা ও বিশেষ সুবিধার ঐতিহাসিক ও চলমান কাঠামোর ফলে সৃষ্ট। এর দ্বারা এ-ও বোঝায় যে, ভাষা পরিকাঠামো নির্মাণে যে সংস্থানগুলি ব্যবহৃত হয় —প্রকাশনা থেকে শুরু করে অ্যাকাডেমিয়া, সরকার ও প্রযুক্তি সংস্থাগুলি —সবই বিশেষ কিছু অঞ্চল (ইউরোপ ও উত্তর আমেরিকা) এবং নির্দিষ্ট কয়েকটি ভাষার (ইংরেজি ও অন্যান্য পশ্চিম ইউরোপীয় ভাষা) পক্ষপাতী। এমনকি, ইউরোপ এবং উত্তর আমেরিকার মধ্যেও আদিবাসী, কৃষ্ণাঙ্গ ও অন্য প্রান্তিক জনগোষ্ঠীগুলি একটি প্রজন্ম থেকে পরবর্তী প্রজন্মে তাদের ভাষা সংরক্ষণ করা কঠিন বলে মনে করছে।

বিশেষ করে, ঔপনিবেশিক ও পুঁজিবাদী শক্তিগুলি বর্ণবাদ, পিতৃতন্ত্র, সমকাম ভীতি এবং/অথবা বিদ্বেষ, সক্ষমতাবাদ, শ্রেণীবাদ ও বর্ণবাদের মত বৈষম্য ও নিপীড়নের অন্যান্য পদ্ধতিগুলির জন্ম দেয়, এবং সেগুলির সঙ্গে মিশে থাকে। এর মানে নির্দিষ্ট কিছু ভাষা —প্রাথমিকভাবে ইউরোপীয় ঔপনিবেশিক ভাষাগুলি -অনলাইনে সবচেয়ে বেশি লক্ষণীয়, তা সে-ভাষাগুলিতে বিশ্বের সর্বাধিক সংখ্যক মানুষ কথা বলুন বা না বলুন। এর দ্বারা এ-ও বোঝায় যে, অন্যান্য আরো প্রান্তিক ভাষাগুলিতে যেসব তথ্য ও জ্ঞান থাকে, সেগুলি যারা ব্যবহার ও তৈরি করতে পারে, তাদের মধ্যেই সীমাবদ্ধ থাকে, অথবা, বাকিদের বিকল্প তথ্য তৈরী করতে দেওয়া হয় না। উদাহরণ হিসেবে বলা যায়, সিংহলি ভাষায় অনলাইনে নারীবাদী কনটেন্টের অভাব, কিংবা বাংলা বা ইন্দোনেশীয় (বাহাসা ইন্দোনেশিয়া) ভাষায় সমকামী ও প্রতিবন্ধী মানুষদের ব্যাপারে ইতিবাচক কনটেন্টের অভাব।

যেহেতু আমাদের পরিচিতির কেন্দ্রে থাকে ভাষা, সেহেতু আমাদের নিজেদের ভাষায় এবং পরিপূর্ণভাবে নিজেদের বিভিন্ন সত্তার প্রকাশ ঘটাতে না পারাটা একধরণের আক্রমণ। কিন্তু এইসব প্রান্তিকীকরণের পরিণতি অন্যরকমভাবে হিংসাত্মক। যেমনটি উদা জানাচ্ছেন, “নারীবাদী, মানবাধিকার বান্ধব, এবং শ্রদ্ধাশীল ডিজিটাল কন্টেন্টের অভাব, অনলাইন স্পেসগুলিকে -যেখানে আঞ্চলিক ভাষায় প্রাথমিক ভাব-বিনিময় হয়, সেগুলিকে নারী, সমকামী ও সংখ্যালঘু মানুষদের প্রতিকূল করে তোলে। মূলধারার বর্ণনাগুলির বিরোধীতা করবে এমন ডিজিটাল মিডিয়ার সুস্পষ্ট অভাব রয়েছে, ফলে তা নেতিবাচক বাঁধাধরা ছকে কলুষিত হয়ে থাকে। যা অনলাইনে ঘৃণাত্মক ভাষণ এবং লিঙ্গ ও যৌন ভিত্তিক সহিংসতাকে আরো বাড়িয়ে তোলে।” এইধরণের হিংসা আদিবাসী, বর্ণগতভাবে নিপীড়িত, এবং ধর্মীয় সংখ্যালঘু জনগোষ্ঠীর দিকে, প্রতিবন্ধী ও ভিন্নভাবে সক্ষম মানুষদের দিকে, এবং অন্যান্য প্রান্তিক সম্প্রদায়ের দিকে প্রসারিত হয়।

একই সময়ে, এই সম্প্রদায়গুলি নিজেদের ও তাদের ভাষার বিরুদ্ধে ঘটে চলা বিভিন্ন ধরণের প্রজন্মব্যাপী সহিংসতার বিরুদ্ধে লড়াই করার জন্য ইন্টারনেটকে ব্যবহার করছে। জেফ্রি ও অ্যাশলে কানাডার যুক্তরাষ্ট্রীয়ভাবে স্বীকৃত ৬০টি আদিবাসী ভাষাগোষ্ঠী জুড়ে ৩৫টিরও বেশি দেশীয় ভাষার হ্যাশট্যাগ এবং ৫৭টি কীওয়ার্ড সহ প্রায় ৩৮০০টি ট্যুইট বিশ্লেষণ করেছেন। তারা দেখেছেন কানাডা ও বিশ্বের অন্যত্র জুড়ে আদি জনগোষ্ঠীর লোকেরা ট্যুইটারে হ্যাশট্যাগের মধ্য দিয়ে দেশীয় ভাষাগুলির পুনরুজ্জীবন ও সমৃ দ্ধি ঘটাতে সক্রিয়ভাবে যোগাযোগ, অংশগ্রহণ ও সহযোগিতা করছেন। তাদের বক্তব্য অনুযায়ী, “এমন একটি সামাজিক প্রেক্ষাপটে, যেখানে কানাডা জুড়ে দেশীয় ভাষাগুলিকে আত্তীকরণের ঔপনিবেশিক নীতি-এর অধীনে মুছে ফেলার লক্ষ্য নেওয়া হয়েছে, সেখানে ট্যুইটার হ্যাশট্যাগ নেটওয়ার্ক আদি জনগোষ্ঠীর জন্য এক অনন্য এবং অর্থপূর্ণ প্রেক্ষাপট প্রদান করার মধ্য দিয়ে দেশীয় ভাষাগুলি সম্পর্কে জ্ঞান ভাগ করে নেওয়ার আহ্বান জানায়।আমাদের গবেষণার অন্তর্গত বিভিন্ন নেটওয়ার্ক জুড়ে ঔপনিবেশিক আত্তীকরণবাদী নীতির অভিঘাত থেকে বেঁচে ওঠা আন্তঃপ্রজন্মের মানুষদের জন্য ভাষা পুনরুদ্ধার ও পুনঃসংযোগের একাধিক উদাহরণ রয়েছে।”

In Dene, the word for Caribou also means Stars. I love that (emoji with heart-shaped eyes) #denecosmology #advancedlanguagesclass)
ডেনে মেলিসা ড্যানিয়েলস এই ট্যুইটটি উদ্ধৃত করার সম্মতি দিয়ে ভাষা শিক্ষক ডেনে এল্ডার (যিনি এই শিক্ষা দিয়েছেন) এবং শিক্ষাবিদ আইলিন বিভারকে স্বীকৃতি দিতে চেয়েছেন।

কাজ

  • ভাষা-পরিকাঠামোকে সাপোর্ট করে এমন বিভিন্ন প্রক্রিয়া ও প্রতিষ্ঠানে বিশেষ সুবিধা এবং ক্ষমতার -কাঠামো ও প্রক্রিয়াগুলি চিনে নিন।
  • ভাষা শিক্ষা ও ভাষা প্রোগ্রামিং সহ প্রান্তিক ভাষা ও সম্প্রদায়গুলিতে ক্ষতিপূরণমূলক সংস্থান নিশ্চিত করুন।
  • যে সম্প্রদায়গুলি বহুবিধ, আন্তঃসম্পর্কযুক্ত নিপীড়ন এবং সহিংসতার শিকার, তাদের থেকে এবং তাদের জন্য, তাদের পছন্দের ভাষায় ও অবয়বে জ্ঞান ও তথ্যের সৃষ্টি এবং প্রসার ঘটানোর জন্য সংস্থানগুলিকে সক্ষম করুন।

মূল্যবোধ এবং জ্ঞান কার?

প্রসঙ্গ

ইন্টারনেটের ইতিহাস ও প্রযুক্তিগুলি পাশ্চাত্য জ্ঞানতত্ত্বের দৃষ্টিভঙ্গির বা জানার ও করার উপায়গুলির উপর ভিত্তি করে গঠিত। আরও নির্দিষ্টভাবে বলা যায়, ইন্টারনেট প্রাথমিকভাবে সাদা চামড়ার (এবং এখন কিছু বাদামী)চামড়ার বিশেষ সুবিধাভোগী মানুষের নকশা করা ও তাদের দ্বারা পরিচালিত হয়েছে, এবং হয়ে চলেছে। এর অর্থ, ইন্টারনেটের স্থাপত্য ও পরিকাঠামোর একেবারে কেন্দ্রে প্রায়শই যে মূল্যবোধগুলি স্থাপিত, সেগুলি প্রযুক্তিগত পরিণামবাদের মূল্যবোধ —যেখানে প্রযুক্তিকে সামাজিক পরিবর্তনের একেবারে প্রাথমিক (ও উপকারী) কারণ হিসেবে দেখা হয় —এই মূল্যবোধগুলি ব্যক্তিস্বাতন্ত্র্যতাবাদেরও, যেখানে প্রাথমিক কেন্দ্রবিন্দু ও পরিচালক কোনো ব্যক্তি, সমষ্টি নয়।

অধিকন্তু, এই দৃষ্টিভঙ্গির মূল রয়েছে এনলাইটেনমেন্টের যুগে, গ্লোবাল নর্থ-কে ঘিরে অষ্টাদশ শতাব্দীতে যৌক্তিকতা-ভিত্তিক বিজ্ঞান ও প্রযুক্তির অভিমুখে শুরু হওয়া যাত্রায়। আমরা ভুলে যাই, অষ্টাদশ শতাব্দীর পূর্বেই গ্লোবাল সাউথে গণিত ও বিজ্ঞান বিকাশ লাভ করেছিল। উদাহরণস্বরূপ, প্রথম লেখা ও সংখ্যা পদ্ধতি মেসোপটেমিয়া, অর্থাৎ বর্তমান ইরান ও ইরাক থেকে এসেছে। আরো নির্দিষ্ট করে বলা যায়, আমরা ভুলে যাই যে, এনলাইটেনমেন্টের রিসোর্সগুলি, গ্লোবাল নর্থে বিজ্ঞান ও প্রযুক্তির এই “স্বর্ণযুগ” ছিল গ্লোবাল সাউথে সাম্রাজ্যবাদের যুগ। এশিয়া, আফ্রিকা, লাতিন আমেরিকা, এবং ক্যারিবিয়ান ও প্রশান্ত মহাসাগরীয় দ্বীপপুঞ্জ জুড়ে ব্যাপক উপনিবেশ স্থাপন, দাসত্ব, গণহত্যা এবং সম্পদের আহরণ চলেছিল। আধুনিক পুঁজিবাদের নিষ্কাশনী মনোভাবের ভিত্তিও এই সমস্ত ঔপনিবেশিক ইতিহাসের মধ্যে রয়েছে, যা টেকনোলজির পুঁজির অংশ হিসেবে আজও চলছে।

এই প্রক্রিয়াগুলিতে পার্থিব সম্পদের পাশাপাশি যা ধ্বংস হয়েছিল, উপেক্ষিত হয়েছিল, বা লঘু করে দেওয়া হয়েছিল, তা হল জানার, করার ও হওয়ার অন্যান্য রূপগুলি। অর্থাৎ, অ-পশ্চিমী জ্ঞানতত্ত্ব, যথা, দেশীয় জ্ঞান, বা বিশ্বের স্বল্প সুবিধাভোগী অঞ্চলের মানুষদের জ্ঞান। যেমনটা আমরা আগে বলেছি, ভাষার ক্ষেত্রে —যা কিনা জ্ঞানের গুরুত্বপূর্ণ প্রতিনিধি, এর সবচেয়ে ধ্বংসাত্মক ফল হয়েছিল, অ-পশ্চিম ইউরোপীয় ভাষাগুলির সম্পূর্ণ অবমূল্যায়ন, এবং সক্রিয়ভাবে মৌখিক ও অলিখিত ভাষাগুলিকে ধ্বংস অথবা অবহেলা করার মধ্য দিয়ে। সুবিধাভোগী ভাষাগুলির সংক্ষিপ্ত পরিসরে, লিখিত কনটেন্টের প্রতি পক্ষপাতিত্ব এখনও প্রকাশনা ও অ্যাকাডেমিয়ায় আমাদেরকে নির্দিষ্ট এক ধরণের “জ্ঞান” এর দিকে ঝুঁকতে শেখায়, যা তারপর স্বাভাবিক ভাষা প্রক্রিয়াকরণের অন্তর্নিহিত তথ্যাদি ও ডকুমেন্টেশনের ওপর প্রভাব ফেলে, বা গুগল-অনুবাদের মত স্বয়ংক্রিয় ভাষা পদ্ধতির ওপর প্রভাব ফেলে, যেগুলি ইন্টারনেটের পরিকাঠামোর অংশ।

যেমনটা অ্যানা বর্ণনা করেছেন, “যদিও বিশ্বের অর্ধেকেরও কম ভাষার লিখন পদ্ধতি নেই, এবং তারা দীর্ঘ একটি মৌখিক ঐতিহ্য রক্ষা করে, সেহেতু যে ভাষাগুলির ব্যাপকভাবে স্বীকৃত ও বিস্তৃত বর্ণমালা রীতি রয়েছে, তারাই ওয়েবে আধিপত্য বিস্তার করে। ওয়েব পদ্ধতিগত বহিষ্কারকে আরো শক্তিশালী করে, যেখানে শুধুমাত্র লিখিত ভাষাগুলিই ভবিষ্যতের জন্য সংরক্ষণ করা যাবে।”

ভাষা হারানোর মধ্য দিয়ে আমরা যতটা বুঝতে পারি তার চেয়েও বেশি আমরা আমাদের ভবিষ্যৎ হারিয়ে ফেলছি। আমরা বিভিন্ন ভাষায় অভিব্যক্তির রূপ এবং সেই ভাষাগুলির অন্তর্নিহিত সমগ্র বিশ্বদর্শন ও জ্ঞান -উভয়ই হারাচ্ছি। এমন এক সময়ে, যখন মানবতা বৈশ্বিক ধ্বংসের দ্বারপ্রান্তে, তখন আমরা জানি, দেশীয় জনগোষ্ঠীগুলি এবং তাদের জ্ঞান আমাদের জীববৈচিত্র্য রক্ষা ও প্রাণ সংরক্ষণ করছে। একথা বলা-ই বাহুল্য যে, ভাষার ক্ষতি জীববৈচিত্র্যের ক্ষতির সঙ্গে প্রত্যক্ষভাবে জড়িত সেইসঙ্গে জড়িত বিশ্বজুড়ে বাস্তুতন্ত্রের ধ্বংসের বিষয়টিও। ইন্টারনেট বিভিন্ন ধরণের ভাষা ও জ্ঞানের সংরক্ষণ ও সম্প্রসারণের একটি চমৎকার পরিকাঠামো হয়ে উঠতে পারে, কারণ এর সমৃদ্ধ মিডিয়া ফর্মগুলি কথ্য, সাঙ্কেতিক ও পাঠ্যের বাইরের শরীরী ভাষাগুলিকে অনুকরণ ও এগুলির প্রতিনিধিত্ব করতে পারে। কিন্তু ইন্টারনেটের এই র‍্যাডিক্যাল প্রতিশ্রুতি যেন আবারও ঔপনিবেশিক-পুঁজিবাদী ও পুরুষতান্ত্রিক মূল্যবোধের ওপর ভিত্তি করে গড়ে না ওঠে –তা দেখা জরুরি। কীভাবে বিভিন্ন সম্প্রদায় তাদের ভাষা ও পরিচয় সংরক্ষণ এবং পুনরুজ্জীবিত করে, সেইসঙ্গে তাদের জ্ঞান, আপন শর্তে ভাগ করে নেয়? উদাহরণস্বরূপ, অনেক আদিবাসী জনগোষ্ঠীতে কিছু জ্ঞান থাকে, যা পবিত্র, এবং প্রকাশ্যে ভাগ করে নেওয়া যায় না।

এইরকম একটি সম্প্রদায় পরিচালিত কাজ হল পাপা রিও, যা আওটিয়ারোয়া/নিউজিল্যান্ডের টেরিও মাওরি (মাওরি ভাষা)-এর একটি ভাষা শনাক্তকরণের প্রযুক্তি। মাওরি জনগোষ্ঠী এই উদ্যোগের প্রযুক্তি ও তথ্য তৈরী করেছে, এবং তারাই এটির রক্ষণাবেক্ষণ করে, এবং তারা বিশ্বাস করে যে, তথ্যের সার্বভৌমত্ব-এর এই রূপটি, ভাষার মধ্য দিয়ে ভাগ করে নেওয়া জ্ঞান যাতে মাওরিদের জন্য ও মাওরিদের দ্বারাই ব্যবহৃত হয় -তা নিশ্চিত করার ক্ষেত্রে গুরুত্বপূর্ণ। লক্ষণীয় যে, মুক্ত-উৎস প্রযুক্তির গুরুত্বকে মাথায় রেখেও, পাপা রিও দলটি তাদের তথ্যগুলি মুক্ত-উৎস তথ্যভান্ডারগুলিতে না দেওয়ার সিদ্ধান্ত নিয়েছে, কারণ মাওরি জনগোষ্ঠী অধিকাংশ মুক্ত-উৎস গোষ্ঠীর সম্পদ ও সুযোগ-সুবিধা থেকে বঞ্চিত হয়ে এসেছে। অন্যদিকে, মুকুর্তু হল এমন একটি মুক্ত-উৎস প্ল্যাটফর্মের উদাহরণ, যা আদিবাসী জনগোষ্ঠীকে সঙ্গে নিয়ে তৈরী হয়েছে, যাতে তারা নিজেদের ভাষার তথ্য নিজেরাই নিয়ন্ত্রণ করতে পারে।

কাজ

  • ইন্টারনেটের জন্য ভাষার পরিকাঠামো তৈরি করুন, সহযোগিতা করুন, এবং ভাগ করে নিন, যেগুলি জনসাধারণের কল্যাণের জন্য, সমষ্টিগত এবং গোষ্ঠীগত মূল্যবোধকে কেন্দ্রে রেখে গড়ে তোলা হয়েছে, এবং যা সার্বভৌমত্ব ও প্রত্যক্ষ রূপের নারীবাদী ও দেশীয় ধারণাকে আশ্রয় দেয়।
  • পুঁজিবাদী, মালিকানাধীন, মানুষের ক্ষেত্রে নিষ্কাশনী মনোভাবাপন্ন, ও পরিবেশের পক্ষে ধ্বংসাত্মক —এইধরণের দমনমূলক যে ভাষা-প্রযুক্তির পরিকাঠামোগুলি রয়েছে, সেগুলির সমালোচনা ও বিরোধিতা জারি রাখুন।
  • মনে রাখুন, যে, বিনামূল্যের ও মুক্ত-উৎস ভাষা-প্রযুক্তিগুলিকে তাদের নিজেদের আপেক্ষিক সুবিধার দিকে নজর দিতে হবে, সেইসঙ্গে প্রান্তিক সম্প্রদায়গুলি যেভাবে “মুক্ত” কথাটির নিজস্ব সংজ্ঞা নির্দিষ্ট করে, এবং যা-তারা বিশ্বের সঙ্গে ভাগ করে নিতে চায় —তাকে সম্মান করতে হবে।

প্রযুক্তি ও মাপকাঠি কার?

প্রসঙ্গ

প্রযুক্তি শিল্প -বর্তমান বিশ্বের অধিকাংশ ভাষার প্রতিনিধিত্ব এবং সাপোর্টের অভাবের জন্য পুরোপুরি দায়ী নয়। কিন্তু গ্লোবাল নর্থের প্রযুক্তিগুলি -ভাষাভিত্তিক অসাম্য ও ডিজিটাল ঔপনিবেশিকরণ বজায় রাখা ও বাড়িয়ে তোলার পেছনে দায়ী।

বৃহৎ প্রযুক্তি-প্রতিষ্ঠানগুলি —যারা আমাদের ব্যবহৃত অধিকাংশ ডিজিটাল প্ল্যাটফর্ম, যন্ত্রপাতি, হার্ডওয়্যার ও সফটওয়্যারের নকশা প্রস্তুত করে, ও সেগুলি তৈরীও করে —তারা সত্যিকারের বহুভাষী ইন্টারনেট তৈরীর প্রয়োজনকে উপেক্ষা করতে পারে, কারণ, তারা আমাদের ৭০০০ কথ্য ভাষার অধিকাংশকে ইন্টারনেটের পরিকাঠামোর প্রয়োজনীয় অংশ হিসেবে দেখে না, বা বিবেচনা করে না। সর্বোপরি, তারা জানে যে তাদেরকে ভাষা সাপোর্ট তখনই যোগান দিতে হবে, যখন সেটা ব্যবসায়িক দিক থেকে লাভবান হবে —হয় ইউরোপীয় ঔপনিবেশিক ভাষার জন্য, নাহয় যাকে তারা বলে “উদীয়মান বাজার” -তার অন্তর্গত ভাষাগুলিতে। প্রকৃতপক্ষে, দক্ষিণ ও দক্ষিণ-পূর্ব এশিয়ার প্রভাবশালী ভাষাগুলি প্রযুক্তির বড় বড় প্ল্যাটফর্মগুলিতে উন্নততর ভাষা সাপোর্ট পেতে শুরু করেছে, কারণ ভাষাগুলি ক্রমেই এই প্রতিষ্ঠানগুলির বৃহত্তম ক্রেতা হয়ে উঠেছে।

একই সময়ে, ইন্টারনেটে সবচেয়ে বিস্তৃত কিছু ভাষা প্রযুক্তি এই সংস্থাগুলির হাতেই তৈরি ও নিয়ন্ত্রিত হয়, কারণ তাদের সেই সম্পদ ও ক্ষমতা রয়েছে। এক্ষেত্রে উইকিপিডিয়া একটি উল্লেখযোগ্য ব্যতিক্রম, কারণ এটি মুক্ত-উৎসের, এবং সারা বিশ্ব থেকে স্বেচ্ছাসেবকেরা একে সমৃদ্ধ করছেন। সাধারণভাবে, মালিকানাধীন এবং মুনাফা চালিত উদ্যোগগুলিতে বিভিন্ন প্রান্তিক ভাষায় গভীর ও সূক্ষ্ম কন্টেন্টের জন্য প্রয়োজনীয় যন্ত্রপাতি ও প্রযুক্তি মেলে না। তার চেয়েও যেটা খারাপ, এইসব সংস্থাগুলি বর্তমানে যেসব ভাষা-প্রযুক্তি তৈরি করে, সেগুলি বড় মাপের স্বয়ংক্রিয় পদ্ধতি -যা যে-কোনো ধরনের উৎস থেকে পাওয়া বিপুল পরিমাণ ভাষা সংক্রান্ত তথ্যের উপর নির্ভরশীল। এমনকি, এর উৎস হিংসা ও ঘৃণা-পূর্ণ ভাষণ, বা প্রান্তিক গোষ্ঠীগুলির বিরুদ্ধে লেখা-ও হতে পারে।

জেফ্রি ও অ্যাশলে-এর বর্ণনা অনুযায়ী, “অধিকাংশ শিক্ষামূলক নেটওয়ার্ক ও বেঁচে যাওয়া দেশীয় ভাষা জুড়ে ট্যুইটারের বাস্তুসংস্থানে বর্ণবাদ বা রেসিজমকে একটি মুখ্য সমস্যা হিসেবে চিহ্নিত করা হয়েছে। আরো নির্দিষ্ট করে, বিভিন্ন পদ্ধতিতে উত্তেজক লেখা ও মাল্টিমিডিয়া কনটেন্ট দ্বারা এই নেটওয়ার্কগুলিকে সক্রিয়ভাবে আক্রমণ করা হয়, যার মধ্যে থাকে ঘৃণাত্মক বক্তব্য তৈরী করা। এই বক্তব্য বিভিন্ন ধরণের ব্যবহারকারী দ্বারা তৈরি হয়, যার মধ্যে আসল মানুষ যেমন থাকে, তেমনই থাকে স্বয়ংক্রিয় বট। বট ব্যবহারকারীদের অ্যাকাউন্টগুলি ভুয়ো তথ্য ছড়ানোর ক্ষেত্রে একই ধরণের পদ্ধতি অনুসরণ করে। এবং প্রায়শই তাদের সামগ্রিক বিশ্লেষণ ও কনটেন্ট তৈরির প্রতিফলন পাওয়া যায় অর্থহীন লেখা প্রচারের মধ্যে।”

যদি কোনো সংস্থা তাদের স্থানীয় ভাষায় অভিজ্ঞতা ও প্রেক্ষাপট জানা না থাকার ফলাফল সম্পর্কে উদাসীন হয়, তাহলে তা অপরিমেয় ক্ষতি এবং সক্রিয় সহিংসতার রূপ নিতে পারে। মায়ানমারে, যেখানে ফেসবুকই (বা মেটা) মূলতঃ ইন্টারনেট, সেখানে ফেসবুক বর্মী ভাষার একটি দল গঠন করার কয়েক বছর আগে থেকে অ্যাক্টিভিস্টরা ঘৃণাত্মক বক্তব্য সম্পর্কে সতর্ক করেছিলেন। ২০১৫ সালে ফেসবুকে চারজন বর্মীভাষী ছিলেন, যারা মায়ানমারে ৭৩ লক্ষ সক্রিয় ব্যবহারকারীর কনটেন্ট মূল্যায়নের দায়িত্বে ছিলেন। ভাষা ও পরিপ্রেক্ষিতের প্রতি এই ঔদাসিন্যের ফলশ্রুতি কী হল? এর অর্থ হল, জাতিসংঘ খুঁজে পেয়েছে যে, মায়ানমারে রোহিঙ্গা মুসলমানদের ওপর ঘটে যাওয়া গণহত্যার অংশ ছিল ফেসবুক, এবং মায়ানমার সরকারের বিরুদ্ধে আন্তর্জাতিক ন্যায়বিচার আদালত-এ একটি মামলার কেন্দ্রে রয়েছে এই সংস্থাটি।

একইরকমভাবে, ভারত ফেসবুকের বৃহত্তম বাজার হওয়া সত্ত্বেও, এবং বিশ্বের সর্বাধিক কথ্য ভাষাগুলির বেশ কয়েকটি এখানে থাকা সত্ত্বেও, মুসলমান, দলিত এবং অন্যান্য প্রান্তিক সম্প্রদায়গুলির বিরুদ্ধে ভারতে ঘৃণাত্মক বক্তব্য অতি সামান্য সক্রিয় পরিমার্জনা সহ জারি রয়েছে। আসলে, সংস্থাটি “বৈশ্বিক রেমিট/ভাষা পরিধি”-এর ৮৪% অর্থই খরচ করে আমেরিকা যুক্তরাষ্ট্রের ভুল তথ্যের পেছনে, যেখানে এদের সমগ্র ব্যবহারকারীর ১০%-এরও কম বাস করেন। বাদবাকি ১৬% পড়ে থাকে বাকি বিশ্বের জন্য।

প্রযুক্তি সংস্থাগুলিকে বুঝতে হবে যে আমাদের ভাষা প্রযুক্তিগুলি গড়ে তুলতে প্রয়োজন সম্পদের বিস্তৃতি ও গভীরতা, সামাজিক-রাজনৈতিক প্রেক্ষাপট, এবং প্রয়োজন নিরাপদ বহুভাষী ডিজিটাল অভিজ্ঞতার প্রতিশ্রুতি।

আমাদের কনট্রিবিউটররা এইরকম অভিজ্ঞতার নির্মাণে —প্রয়োজন, প্রতিকূলতা ও সুযোগের পরিসরের কথা বলেন। আরো নির্দিষ্ট করে, পরিকাঠামোর অভাব (ইন্টারনেটে প্রবেশ করা থেকে শুরু করে কার্যকরী যন্ত্র অবধি) এবং সব ভাষার জন্য সহায়ক প্রযুক্তির অভাব প্রান্তিক ভাষাগুলির ডিজিটাল ব্যবহারকে ক্লান্তিকর, কঠিন, ধীর এবং অবাস্তব করে তোলে। আমরা কয়েকটা জোরালো উদাহরণ দিচ্ছি।

কোনো প্রান্তিক ভাষার জন্য ভাষা প্রযুক্তি সাজিয়ে তোলার ঘটনা অতি বিরল।

ডোনাল্ড মালাউইতে তাঁর সম্প্রদায়ের পক্ষে তাঁদের নিজেদের ভাষায় সহজে যোগাযোগের জন্য ইন্টারনেট ব্যবহার করার ক্ষমতা ও ডিভাইস থাকা কতটা বিরল -তা নিয়ে কথা বলেছেন। তিনি ২০জন চিন্দালিভাষীর সাক্ষাৎকার নিয়েছেন, যাদের মধ্যে ১০জন পড়ুয়া, এবং বাকি দশজন ছিলেন প্রবীণ মানুষ। এই কুড়িজনের মধ্যে মাত্র পাঁচজনের স্মার্টফোন বা ফিচার ফোন ছিল, এবং সাতজনের কাছে কোনো ডিভাইস ছিল না। এই কুড়িজনের মধ্যে মাত্র চারজনের ল্যাপটপ ছিল, তারা সকলেই পড়ুয়া। ইন্টারনেট ব্যবহারের ক্ষেত্রে কেবলমাত্র কলেজপড়ুয়াদের কাছে, কলেজের মাধ্যমে অথবা ব্যক্তিগত ডেটা প্ল্যান ছিল।

অনলাইন হলে, বিশ্বের বেশিরভাগ মানুষই তাদের নিজেদের ভাষায় কি-বোর্ড ব্যবহার করতে পারেন না। অধিকাংশ সম্প্রদায়কেই এমন কি-বোর্ড ব্যবহার করে কাজ সারতে হয়, যা প্রাথমিকভাবে ইউরোপীয় ভাষাগুলির জন্য বানানো হয়েছিল। সেখানে তাদের নিজেদের ভাষা থেকে অক্ষর পেস্ট করতে হয়। এটা ফোনের ছোট্ট কি-বোর্ডের ক্ষেত্রে একেবারেই অসম্ভব। প্রাথমিকভাবে যেসব ভাষা মৌখিক, এবং যেগুলির কোনো মান্য লিখন পদ্ধতি নেই, তাদের ক্ষেত্রে এটা আরো বেশি কঠিন।

যেমনটা অ্যানা তাঁর ভাষা সম্পর্কে বলছেন, “আমাদের ভাষার ধ্বনি ও স্বর উপস্থাপন করার জন্য কি-বোর্ডে সঠিক জ্যাপোটেক চিহ্ন নেই। ল্যাটিনের মত আদিবাসী ভাষাগুলি লেখার একটি প্রমিত রীতি তৈরি করার লক্ষ্যে ঐক্যমত্যে পৌঁছনোর জন্য বহু বছর ধরে আলাপ-আলোচনা চলছে। এমন একটি লিখন পদ্ধতি, যা পশ্চিমের দ্বারা কতকটা চাপিয়ে দেওয়া ও প্রভাবিত, এবং একইসঙ্গে সেই ভাষাভাষীদের একটি অংশের প্রয়োজনীয় ও তাদের দ্বারা গৃহীত।” আর্রেন্টের মত ভাষাগুলির ক্ষেত্রে এটা আরো কঠিন, যেগুলিতে স্বর ও অঙ্গভঙ্গি বা সংকেত একত্রিত হয়, জোয়েল ও ক্যাডি ইন্ডিজেমোজি প্রকল্পের মাধ্যমে এমনটাই বলেছেন আমাদের।

আপনি যদি এমন কোনো গোষ্ঠীর মানুষ হন, এই বিশ্বে যিনি নিজেকে অনিরাপদ ও অসুরক্ষিত মনে করেন, এবং ইন্টারনেট আপনার ভাষায় পরিকল্পিত না হয়, তাহলে আপনার পক্ষে নিজের ও নিজের গোষ্ঠীকে সঙ্গে নিয়ে সহজে, দৃশ্যমান, প্রাসঙ্গিক এবং জরুরি কনটেন্ট তৈরি করা। পাস্কা বাহাসা ইন্দোনেশিয়া ভাষায় এলজিবিটিকিউআইএ-প্লাস কনটেন্টের ওপর কাজ করতে গিয়ে তাদের নিবন্ধে বলছেন, “ইন্দোনেশিয়ার বহু এলজিবিটিকিউআইএ+ সম্প্রদায়ের মানুষ এখনও কোনো একটি ওয়েবসাইটের প্রযুক্তিগত দিকগুলি সম্পর্কে অবহিত নন, সেইসঙ্গে কোনো সার্চ ইঞ্জিন কীভাবে কাজ করে -সে-সম্পর্কে পর্যাপ্ত ধারণাও তাদের নেই।” গ্লোবাল নর্থের সুবিধাপ্রাপ্ত অঞ্চলের প্রান্তিক সম্প্রদায়গুলিও তাদের নিজেদের ভাষায় জীবন নিশ্চয়কারী ও জীবন রক্ষাকারী কন্টেন্ট না থাকার সমস্যাটির মুখোমুখি হয়। জেফ্রি ও অ্যাশলে ব্যাখ্যা করে বলছেন: “মূল সমস্যাগুলির একটি হল… বর্তমানে কানাডার প্রেক্ষাপটে দেশীয় ভাষাগুলি অনুবাদের যে প্রযুক্তি রয়েছে তার সীমাবদ্ধতা। Hul’qumi’num (হালকুমিনাম), Sḵwx̱wú7mesh (স্খুয়ামিশ), Lewkungen (লাইকুয়ানজেন) ও Neheyawewin (ক্রি) -এর মত দেশীয় ভাষাগুলিকে ট্যুইটারের অনুবাদ প্রযুক্তি -জার্মান, এসটোনিয়ান, ফিনীয়, ভিয়েতনামীয়, এবং ফরাসি ভাষা ভেবে ভুল করে।”

সব মিলিয়ে, উদা জানাচ্ছেন, “উপযুক্ত সরঞ্জামের অভাব, এবং যে সরঞ্জামগুলি আছে, সেগুলির জটিলতার কারণে আঞ্চলিক ভাষায় ডিজিটাল কন্টেন্ট তৈরী করাটা একটা চ্যালেঞ্জ হিসেবেই থেকে যায়। আঞ্চলিক ভাষায় কন্টেন্ট তৈরি করতে বিশেষ সরঞ্জাম ও দক্ষতা প্রয়োজন হয়। আঞ্চলিক ভাষায় প্রগতিশীল বিষয়বস্তুর অভাব দেখা যাওয়ার নেপথ্যে এই সমস্যাটি কাজ করছে।”

ভাষা-প্রযুক্তি বেশিরভাগ সময়ই সাম্য এবং নিরাপত্তার চেয়ে লাভকে অগ্রাধিকার দিয়ে উপর থেকে চাপিয়ে দেওয়া পদ্ধতিতে গড়ে তোলা হয়েছে। ক্লডিয়া অধিকাংশ প্রযুক্তি সংস্থার এই অভিমুখকে স্পষ্টভাবে বর্ণনা করেছেন, যখন তিনি বলছেন: “বড় বড় সংস্থাগুলি [এই] মিডিয়া ও প্রযুক্তি ব্যবস্থাকে উপর থেকে নিচের দিকে চাপিয়ে দেয়, সেখানে ঐ ভাষাভাষী সম্প্রদায়ের কোনো অংশগ্রহণ থাকে না। এই ক্ষেত্রে, অনুগ্রহ করার একটা মানসিকতাও লক্ষ করা যায়: যেহেতু খুব কম আছে, তাই যা-কিছু দেওয়া হচ্ছে তা-ই ভালো, এবং তাকে স্বাভাবিকভাবেই স্বাগত জানাতে হবে। প্রায়শই সংস্থাগুলি -সংখ্যালঘু ভাষাভাষীদের আসল প্রয়োজন, চাহিদা এবং প্রত্যাশাগুলিকে বিবেচনায় না এনে চটজলদি সমাধান পেশ করে। যেন এটা ধরেই নেওয়া হয় যে এই ভাষাভাষীদের যে পণ্য বা সুযোগই দেওয়া হোক, তার জন্য তাদের কৃতজ্ঞ থাকা উচিত, তাতে যদি সেগুলো আসলে আকর্ষণীয়, বা তাদের জীবনযাপনের ক্ষেত্রে প্রাসঙ্গিক না-ও হয়, তবুও। এই আচরণের উল্লেখযোগ্য ব্যতিক্রম ভ্যান এসচ ও তাঁর সহযোগীরা (২০১৯) দেখিয়েছেন, তারা অকৃত্রিম ভাষা প্রক্রিয়াকরণের অ্যাপ্লিকেশনগুলি গড়ে তোলার পরিকল্পনার সময় সেই ভাষাভাষীদের সঙ্গে ঘনিষ্ঠ সহযোগিতার প্রয়োজনের ওপর বারংবার জোর দিয়েছেন।”

এই পদ্ধতিটি -যে প্রেক্ষাপটে প্রান্তিক ভাষা সম্প্রদায়ের মানুষজন থাকেন, এবং তাদের ভাষাগুলিকে সূক্ষ্ম ও সমৃদ্ধ উপায়ে অনলাইনে তুলে ধরতে নকশার যে তারতম্য দরকার, সেগুলি প্রায় বুঝতেই পারে না। যখন এমনা সুদানের গামিলের সাক্ষাৎকার নিচ্ছিলেন, তখন তিনি সুদানীয় আরবি ভাষায় বলছিলেন, “সুদান এমন একটি দেশ, যেখানে অজস্র উপজাতি রয়েছে, সেইসঙ্গে রয়েছে বিভিন্ন ধরণের ঐতিহ্য ও রীতিনীতি। অতএব, উত্তর সুদান আরবি উপভাষায় কথা বলে (আমি নিজে যা ব্যবহার করছি), এবং সেটা অবশ্যই ঔপনিবেশিকতার কারণে। আবার পূর্ব ও পশ্চিম অংশের জনজাতিরা অন্য একটি আঞ্চলিক ভাষায় কথা বলেন, যা কেবলমাত্র তারাই বলতে ও বুঝতে পারেন। উত্তর অংশের লোকেদের পক্ষে এটি বুঝতে পারা লোকের সংখ্যা খুবই কম, যদি না সে ওখানে গিয়ে থাকে, এবং তাদের সঙ্গে কথোপকথন চালিয়ে থাকে। আমাদের ভাষার উৎপত্তি কুশিটিক ভাষা থেকে। কুশিটিক এবং নুবিয়ান সভ্যতা আমাদের পূর্বসূত্র। যখন উঁচু বাঁধ ডুবে গেল, আমরাও আমাদের কুশিটিক সত্তা হারিয়ে ফেললাম, আমরা এমন কোনো অভিধান পাইনি, যার সাহায্যে ভাষাটি পুনরুদ্ধার করে অন্য ভাষায় অনুবাদ করা যায়। অবশ্য নুবিয়ান ভাষা পরিচিত এবং অনূদিত। নুবিয়ান ভাষা এমনকি ওয়াওয়ে(Huawei) -এর মোবাইল ফোনেও মোবাইল সেটিংসের একটি ভাষা হিসেবে রয়েছে। পূর্ব এবং পশ্চিম অংশের ভাষাগুলি লিখিত ভাষা নয় (বা হয়তো লেখা হয়, আমি ঠিক জানি না, খোঁজ নিতে হবে)। উত্তর অংশে, আমরা আরবিতে কথা বলি। আমরা আফ্রিকান এবং আরবিভাষী, কিন্তু আরব নই।”

এই সাক্ষাৎকারগুলি এমনাকে একথা বলতে প্ররোচিত করেছিল: “ওয়েবের তার সমস্ত ব্যবহারকারীদের প্রয়োজন, যারা লেখেন এবং যারা লেখেন না -সকলকেই। যাহোক, পরিবর্তন –কঠোরভাবে ব্যবহারকারীরই দায়িত্ব নয়, যে সংস্থাগুলি সফ্টওয়্যার নকশা করে ও সেগুলির বিকাশ ঘটায়, তাদেরকেও অতি অবশ্যই ওয়েবের ভবিষ্যৎ রূপের দায়িত্ব নিতে হবে। আজকের দিনে দাঁড়িয়ে মনে হচ্ছে সকলেই অন্তর্ভুক্তির কথা বলছেন, বর্ণবাদ, বৈষম্য ও উপনিবেশবাদের অন্যান্য রূপগুলির বিরুদ্ধে লড়াই করার কথা বলছেন। যাইহোক, ওয়েবে পরিবর্তন আনতে গেলে, কর্পোরেশনগুলির আলোচনা করা উচিত যে তারা কীভাবে বহিষ্করণকে স্থায়ী করবে; ওয়েব পরিকল্পক, ওয়েব প্রযুক্তির ইঞ্জিনিয়ার, প্রযুক্তি সংস্থাগুলির মালিক -এদেরকেও তাদের সফটওয়্যার সমস্ত ব্যবহারকারীর কাছে পৌঁছে দেওয়ার জন্য এগিয়ে আসতে হবে।”

যে উপায়ে বহিষ্করণের বিভিন্ন রূপকে সমালোচনামূলকভাবে বিশ্লেষণ করা যায়, তা হল এটা মেনে নেওয়া যে ডিজিটাল প্রযুক্তির মূল ভিত্তি —কোড —মুখ্যতঃ ইংরেজিতে। অন্যান্য ভাষার উপর ভিত্তি করে খুব কম প্রোগ্রামিং ভাষা রয়েছে, যার মানে, কোনো ভাষায় কোড তৈরি করতে গেলে প্রযুক্তিবিদদের নিজেদেরকে ইংরেজি খুব ভালোভাবে জানতে হবে। এই প্রবণতা ভাঙার চেষ্টা করা কয়েকটি উদাহরণের একটি হল আরবি অন্বয় ও চারুলিপির উপর ভিত্তি করে তৈরি প্রোগ্রামিং ভাষা কোয়াল্ব। যাহোক, সাধারণভাবে, প্রযুক্তিশিল্পকে বুঝতে হবে, কীভাবে ভাষার সুবিধা প্রত্যেক প্রযুক্তি, এবং অধিকাংশ প্রযুক্তিবিদদের মধ্যে এনকোড করা থাকে।

জেফ্রি ও অ্যাশলে-এর কথা অনুযায়ী: “আমাদের গবেষণা স্পষ্ট করে যে ইন্টারনেটে দেশীয় ভাষার উত্তরণের মূল অতি অবশ্যই ইন্টারনেটের প্রযুক্তির সমালোচনামূলক বিশ্লেষণের মধ্যে নিহিত থাকতে হবে। পাশাপাশি, এর ব্যবহারকে ঘিরে যে সামাজিক প্রক্রিয়াগুলি রয়েছে সেগুলিকেও এর সাথে জুড়তে হবে।

কাজ

  • একথা স্বীকার করুন যে, ভাষার কথকদের নকশা করা ও তৈরি করা বহুভাষিক প্রযুক্তি ও কন্টেন্ট একটি মৌলিক মানবাধিকার, যা প্রযুক্তি ও মানক সংস্থাগুলির অগ্রাধিকারের সঙ্গে দেখা উচিত। এবং এতে ইউনেসকো -এর মত বিশ্বব্যাপী সংস্থাগুলির সমর্থন প্রয়োজন।
  • সম্প্রদায়গুলির—নেতৃত্বে এমন একটি ভাষা পরিকাঠামো গড়ে তুলুন, যা বিশ্বাস ও সম্মানের সঙ্গে প্রযুক্তি সংস্থা এবং অন্য প্রতিষ্ঠানগুলির অংশীদারিত্বে কাজ করবে।
  • সম্প্রদায়গুলির সম্মতি ও নীতিকে কেন্দ্রে রেখে তবেই ভাষা সম্পর্কিত তথ্য ও প্রযুক্তি তৈরি করুন, যাতে তারা কী এবং কীভাবে ভাগ করে নেবে তার ওপর ভাষা সম্প্রদায়গুলির নিয়ন্ত্রণ ও সুরক্ষা থাকে; বিশেষ করে সেই প্রান্তিক সম্প্রদায়গুলির জন্য, যারা নিপীড়ন ও বৈষম্যের নানা সম্মিলিত ব্যবস্থার শিকার।

নকশা ও কল্পনা কার?

আমাদের ভাগ করে নেওয়া বিভিন্ন পরিসংখ্যান ও বিবরণ থেকে আমরা জানি যে অর্থপূর্ণ এবং কার্যকরী ভাষা-প্রযুক্তি একমাত্র তখনই সম্ভব, যখন আমরা কোনো ভাষা সম্প্রদায়ের চাহিদা, নকশা ও কল্পনাকে এর কেন্দ্রে রাখি। প্রান্তিক ভাষাগুলির বিকাশ ও সম্প্রসারণ তখনই হবে, যখন বিশ্বের মাইনরিটাইজড মেজরিটিরা প্রযুক্তি নির্মাণের অংশ হবে।

আমাদের কন্ট্রিবিউটররা এটি নিশ্চিত করার জন্য বিভিন্ন উপায় গ্রহণের পরামর্শ দেন। যার মধ্যে আছে, প্রযুক্তি কোম্পানিগুলির তরফে প্রান্তিক ভাষা-সম্প্রদায়ের মধ্যে থেকে প্রযুক্তিবিদ ও অন্যান্য বিশেষজ্ঞদের নিয়োগ করা, সেইসঙ্গে, এই কাজে সম্প্রদায়গুলিকে দায়িত্বের সঙ্গে যুক্ত করা। তারা কোনো একটি একক সূত্রগত পদ্ধতির পরিবর্তে ভাষার প্রেক্ষাপটের উপর ভিত্তি করে কাঠামো এবং পদ্ধতিগুলির বহুত্বের সুপারিশ করেন। ক্লডিয়া যেমনটা বলেছেন, “সংখ্যালঘু ভাষাভাষীদের চটজলদি সমাধান প্রয়োজন নেই: তাদের নির্দিষ্ট প্রয়োজন ও চাহিদাগুলির কথা শুনতে হবে, এবং সেই চাহিদা অনুযায়ী পণ্যদ্রব্য প্রস্তুত করতে হবে। বিভিন্ন সংখ্যালঘু ভাষার সমাজভাষাতাত্ত্বিক প্রেক্ষাপট অনেকটাই অন্যরকম হতে পারে, ফলে তার সমাধানগুলিও সেরকমই হতে হবে।”

আমাদের কন্ট্রিবিউটররাও তাদের কাছে উপলব্ধ প্রযুক্তি ব্যবহার করে তাদের ভাষা সংরক্ষণ ও সম্প্রসারণের জন্য তাদের নিজেদের সম্প্রদায়ের দায়িত্ব ও কর্তব্যের কথা বলেন। ঈশান বলছেন, “একজন ক্যুইয়ার ও দৃষ্টি প্রতিবন্ধী মানুষ হিসেবে আমি মনে করি, নিজের আর্থ-সামাজিক-সাংস্কৃতিক সম্পদগুলিকে ব্যবহার করে নিজের অভিজ্ঞতা, আকাঙ্খা ও দাবী নিজেকেই প্রকাশ করতে হবে। ইন্টারনেটকে প্রকৃত অর্থে ইনক্লুসিভ ও অ্যাকসেসিবল করে তোলার দায়িত্ব আমাদের, অর্থাৎ ইন্টারনেট ব্যবহারকারীদেরই নিতে হবে।”

অ্যানা বিশ্লেষণ করে দেখাচ্ছেন যে কীভাবে, যে প্ল্যাটফর্মগুলি লেখার ওপর নির্ভর করে সেগুলির চেয়ে যেগুলিতে মৌখিক এবং দৃশ্য-পরিকাঠামো বেশি ভালো সেগুলি —তাদের সম্প্রদায়ের লোকেরা বেশি ব্যবহার করেন। “আজকের দিনে দাঁড়িয়ে, জ্যাপোটেক ভাষার ক্ষেত্রে সাইবারস্পেসে লিখিত ভাষার চেয়ে মৌখিকতা বেশি ব্যবহৃত হয়। ইউটিউব, ফেসবুক, হোয়াটসঅ্যাপ এবং ইন্সটাগ্রামের মত সামাজিক প্ল্যাটফর্মগুলি মৌখিক ভাষার জন্য উপলব্ধ ও বন্ধুত্বপূর্ণ রিসোর্স। এই প্ল্যাটফর্মগুলি ব্যবহারকারীদের বার্তাকে সমৃদ্ধ করে ছবি বা ভিডিও দিয়ে গড়া কনটেন্ট আপলোড করার অনুমতি দেয়, কোনোরকম লেখালিখির কঠোরতার বদলে যেভাবে ব্যবহারকারীরা বার্তা দিতে চান, সেভাবেই। এই নির্দিষ্ট প্ল্যাটফর্মগুলিরই বিশ্বজুড়ে সবচেয়ে বেশি ব্যবহারকারী রয়েছে, এবং আদিবাসী জনগোষ্ঠীগুলিও এগুলি ব্যবহার করেন। সিয়েরা জ্যাপোটেক সম্প্রদায়ের ক্ষেত্রে, অধিকাংশ ব্যবহারকারীই ফেসবুকের মাধ্যমে ইন্টারনেটের সঙ্গে যুক্ত হন, যেখানে তারা ঐতিহ্যবাহী উৎসব, নৃত্য, সঙ্গীত, গুরুত্বপূর্ণ অনুষ্ঠানের বর্ণনা এবং অভিবাসী ও স্থানীয় সম্প্রদায়ের জন্য নানারকম ঘোষণা সম্প্রচার করেন। কোভিড-১৯ -এর আগেই তাদের অভিবাসী পরিবারগুলির জন্য শোকপালনে ফেসবুক গুরুত্বপূর্ণ ভূমিকা পালন করছিল, কারণ অন্ত্যেষ্টি এবং আচারগুলি এর মাধ্যমে সম্প্রচারিত হত। এই একই প্ল্যাটফর্ম কিছু জ্যাপোটেক সম্প্রদায় রেডিও প্রোগ্রামিং পুনঃসম্প্রচারের কাজে ব্যবহার করে, যা গ্রামীণ এলাকায় ব্যপকভাবে ব্যবহৃত রেডিওর মত অ্যানালগ যোগাযোগমাধ্যমের সঙ্গে ইন্টারনেটের মত সর্বজনীন এবং সর্বব্যাপী স্পেসের মধ্যে সেতুবন্ধন ঘটায়।

যারা ভাষার লিখিত রূপগুলি ব্যবহার করতে পারেন তাদের জন্য হ্যাশট্যাগগুলি তাদের নিজস্ব ভাষা শিখতে ও ছড়িয়ে দিতে, সেইসঙ্গে অন্যান্য সম্প্রদায়কে অনুপ্রাণিত করতেও —ডিজিটাল মাধ্যমে সংযুক্ত থাকার একটা চমৎকার উপায় হয়ে উঠেছে। জেফ্রি ও অ্যাশলে যেমনটা জানাচ্ছেন: “ এমন একটি সামাজিক প্রেক্ষাপট, যেখানে আত্তিকরণের ঔপনিবেশিক নীতির প্রভাবে কানাডা জুড়ে দেশীয় ভাষাগুলিকে মুছে ফেলার চেষ্টা হচ্ছে, সেখানে, ট্যুইটারের হ্যাশট্যাগ নেটওয়ার্কগুলি আদিবাসী জনগোষ্ঠীর মানুষদের, তাদের ভাষা সম্পর্কিত জ্ঞান ভাগ করে নেওয়ার অনন্য ও অর্থপূর্ণ পরিসর প্রদান করেছে… উদাহরণস্বরূপ, গুইচিন ভাষা শিক্ষার্থীদের একটি হ্যাশট্যাগ নেটওয়ার্ক Anishnaabemowin (ওজিবওয়ে) শিক্ষার্থীদের তাদের নিজস্ব হ্যাশট্যাগ নেটওয়ার্ক তৈরি করতে অনুপ্রাণিত করেছে। একইরকমভাবে, টুইটারে Neheyawewin (ক্রি) ভাষার একটি নেটওয়ার্ক হালকুমিনাম ভাষা শিক্ষার্থীদের তাদের নিজস্ব টুইটার ভিত্তিক ‘আজকের শব্দ’ চালু করতে অনুপ্রাণিত করেছে।

প্রান্তিক সম্প্রদায়গুলির হাতে এইসব মালিকানাধীন প্ল্যাটফর্মগুলির বিস্তৃত ও সৃজনশীল ব্যবহার —এটি প্রযুক্তি সংস্থাগুলির ক্ষেত্রে তাদের বিরুদ্ধে না গিয়ে, তাদের সঙ্গে কাজ করার পক্ষে একটি তাৎপর্যপূর্ণ কারণ।

একইসঙ্গে, ক্লডিয়া সতর্ক করছেন যে প্রান্তিক জনগোষ্ঠীগুলির ভাষা-আন্দোলন কর্মীদের আরো অবগত হতে হবে ও পরস্পরের সঙ্গে সমন্বয় বাড়াতে হবে, যাতে তারা এই প্রক্রিয়ায় শক্তি ও সম্পদ না হারায়। “প্রশংসনীয় হলেও, এইসব [আন্দোলনকর্মীদের] উদ্যোগগুলি সমন্বয়হীনতা, কম পরিকল্পনা, এবং এমনকি অপেক্ষাকৃত কম খুঁজে পাওয়ার সমস্যায় ভোগে। এর ফলে যাদের রিসোর্স সীমিত, সেইসব সম্প্রদায়ের জন্য একটি গুরুতর সমস্যা তৈরি হয়, : অসফল প্রচেষ্টার পুনরাবৃত্তি। উভয় ক্ষেত্রেই, মূল সমস্যা হল ইতোমধ্যেই যা উপলব্ধ এবং যা প্রয়োজন সেসব -বিষয়ে জ্ঞানের স্বল্পতা। সংখ্যালঘু ভাষার ক্ষেত্রে ভাষা প্রযুক্তিকে ঔপনিবেশিকরণের বাইরে বের করে আনতে গেলে ডিজিটাল মাধ্যমে সংখ্যালঘু ভাষাগুলি কী পরিমাণে ব্যবহৃত, কত ঘন ঘন ব্যবহার হচ্ছে, এবং কী উদ্দেশ্যে ব্যবহার হচ্ছে -এসবের আরো স্পষ্ট একটা ছবি পাওয়া জরুরি। যখন (যদি) সংখ্যালঘু ভাষাভাষীরা নিজেদের ভাষা ব্যবহার করতে যায়, তখন তারা কী কী বাধার মুখোমুখি হয়: তাদের কি প্রযুক্তিগত সমস্যা হয়? তারা কি কোনো স্বতঃপ্রবৃত্ত প্যারানোইয়ার ফলে আটকে আছে? যেহেতু কোনো সংখ্যালঘু ভাষায় লেখা মানে একরকমভাবে বাইরের বিশ্বের সামনে উন্মোচিত হয়ে যাওয়া, ফলে তারা কি উপহাস বা কলঙ্কের ভয়ে এসব করা থেকে বিরত থাকে? একইরকমভাবে, ডিজিটাল সুযোগসুবিধার বিষয়ে সংখ্যালঘু ভাষাভাষীদের আকাঙ্খা নিয়ে খুব কমই জানা যায়, তারা কী চায় বা প্রত্যাশা করে? —এইসব বিষয়ে জানাও সমানভাবে জরুরি।”

বর্তমান প্রতিবেদনটি এইসমস্ত প্রতিকূলতা এবং তা কাটিয়ে ওঠার উপায় সম্পর্কে বোঝার একটি পদক্ষেপ। বিভিন্ন ভাষার জন্য একই জিনিস বারবার করে করলে কোনো কাজ হবে না। উদাহরণ হিসেবে বলা যায়, ইংরেজিতে একটা অ্যাপ তৈরি করে যদি ভেবে নেওয়া হয় ইন্দোনেশীয় (বাহাসা ইন্দোনেশিয়া) ভাষার ক্ষেত্রেও সেটা একইরকম যুক্তিসঙ্গতভাবে কাজ করবে —তাহলে তা গভীর সমস্যাজনক। ইন্টারনেটকে আরো উন্নত করে তোলার অর্থ হল মানুষের মধ্যে ক্ষমতার গতি পরিবর্তন করা, কেবলমাত্র প্রযুক্তিগত সমস্যার সমাধান করা নয়। এবং ইন্টারনেটে বহুভাষিকতা হল একগুচ্ছ জটিল সামাজিক-প্রযুক্তিগত এবং রাজনৈতিক সমস্যা। ইন্টারনেট প্রযুক্তিগুলি নয়, আমাদের ভাষা-সম্প্রদায়গুলির চাহিদাকে প্রথমে রাখতে হবে —এইভাবে ভাষা প্রযুক্তি আরও ফলপ্রদ ও কার্যকরী হয়ে উঠবে।

সবচেয়ে তাৎপর্যপূর্ণ, আমরা জানি যে, যাদেরকে আমরা বিশ্বের “মাইনরিটাইজড মেজরিটি” বলি, তাদের পরিকল্পনা এবং কল্পনা-ই আমাদের ভাষা পরিকাঠামোকে আরও ভালোভাবে পরিবর্তন করবে। “ইন্ডিজেমোজি মধ্য অস্ট্রেলিয়ায় নতুন সংযোগ ও দ্রুত প্রযুক্তির আধুনিকীকরণের গুরুত্বপূর্ণ সময়ে এসেছে। এই প্রকল্প স্থানীয় লোকেদের আমন্ত্রণ জানায় নতুন প্ল্যাটফর্মগুলির সঙ্গে তারা কী করতে পারে সে বিষয়ে ভাবার জন্য। তারা কেন কেবলমাত্র অপর একটি ঔপনিবেশিক শক্তি নয়? এবং, কীভাবে আমরা আমাদের ভাষা ও সংস্কৃতিকে তাদের মধ্যে বসিয়ে দিতে পারি, যাতে সেগুলি আমাদের নিজেদের হয়ে ওঠে?”

কাজ

  • যে প্রযুক্তি মনে করে একটি ভাষাই সবার জন্য খাটবে, তার বদলে, ভাষা প্রযুক্তিকে —আঞ্চলিক ভিত্তিতে প্রতিষ্ঠিত, কিন্তু বিশ্বজুড়ে সংযুক্ত ভাষা সম্প্রদায়ের প্রেক্ষাপট, চাহিদা, নকশা ও কল্পনার কেন্দ্রে স্থাপন করুন।
  • এমবডিড ভাষাগুলির (মৌখিক, দৃষ্টিগ্রাহ্য, অঙ্গভঙ্গীমূলক, পাঠ্য…) সম্পূর্ণ ব্যাপ্তিকে অন্বেষণ করতে ইন্টারনেটের টেকনোলজিগুলির পূর্ণ পরিসরকে সৃজনশীল ভাবে কাজে লাগান, যাতে জ্ঞানের বিবিধ রূপকে সহজে ও অবারিতভাবে প্রকাশ করা যায় এবং ভাগ করে নেওয়া যায়।
  • আমাদের আদিবাসী জনগোষ্ঠীগুলির কাছ থেকে শিখুন কীভাবে আগামীর জন্য পরিকল্পনা করার পাশাপাশি সম্মিলিত ও সম্প্রদায়ের স্মৃতিকে সম্মান করে ভাষা-প্রযুক্তির নকশা করা যায়। চলুন, আমরা পিছন ফিরে আমাদের ভবিষ্যতের দিকে হাঁটি

পরিশেষে, আপনি কী করতে পারেন?

কেউ যদি আপনার মত ভালো ইংরেজি বলতে না পারে, তার মানে এই নয় যে সে বোকা, বরং তার মানে এই যে, সে বিশ্বের অন্য ৭০০০-টি ভাষার একটিতে আরও ভালোভাবে কথা বলতে পারে।

সত্যিকারের বহুভাষিক ইন্টারনেট তৈরি করতে ও সম্প্রসারণ ঘটাতে আমাদের সকলকে নিজেদের বিভিন্ন দক্ষতা ও অভিজ্ঞতা নিয়ে একজোট হয়ে কাজ করতে হবে। আমাদের এটাও নিশ্চিত করতে হবে, এই যে নানা ভাষায় আমরা তথ্য ও জ্ঞান ভাগ করে নিই, তা যেন ক্ষতির কারণ না হয়। বরং তার পরিবর্তে আমাদের বিশ্বের সামগ্রিক কল্যাণের দিকে নিয়ে যায়। যাকে আমরা ‘কর্মে সংহতি’ বলি, তা-ই আমাদের প্রয়োজন।

আপনি যদি প্রযুক্তি বিষয়ক কাজের সঙ্গে যুক্ত থাকেন:

  • আপনার সংস্থার নীতিগুলি কীভাবে ইন্টারনেটের বহুভাষিকতায় এবং মানুষের জ্ঞানকে আরো গভীর করে তুলতে অবদান রাখছে (বা রাখছে না) —তা উপলব্ধি করুন।
  • প্রান্তীয় বিষয় হিসেবে না দেখে (প্রান্তিক) ভাষার আন্তর্জাতিকীকরণ ও স্থানীয়করণের কাজকে আপনার পরিকল্পনার কেন্দ্রে স্থাপন করুন। এটিকে উপর থেকে চাপিয়ে দেওয়া এবং প্রসঙ্গ থেকে বিচ্ছিন্ন কোনো কাজ হিসেবে না করে সম্প্রদায়ের সঙ্গে যৌথভাবে করুন।
  • স্বয়ংক্রিয় ভাষা-প্রযুক্তি ও বৃহৎ ভাষা মডেলগুলির ওপর ভালোভাবে করা গবেষণার সমালোচনা গ্রহণ করুন, এবং বুঝুন যে, মানুষের সুচিন্তিত তদারকি ছাড়া সেগুলি ব্যাপক ক্ষতির কারণ হয়ে দাঁড়াতে পারে।
  • সম্প্রদায় নিয়ন্ত্রিত ছোট ছোট ডেটাসেট ব্যবহার করে সমস্ত ভাষার কাজের প্রেক্ষাপট, সঞ্চয়ন, ও মডারেশন করার যত্নশীল মানবিক প্রক্রিয়া তৈরি করুন।
  • সম্প্রদায়গুলির সঙ্গে শ্রদ্ধাসহকারে কাজ করুন, বিশেষ করে যারা সবচেয়ে প্রান্তিক, এবং যত্ন ও মনোযোগের অভাবে সবচেয়ে বেশি ক্ষতিগ্রস্ত হতে পারে।
  • এই ভাষা সম্প্রদায়গুলির মধ্যে যারা আপনাকে অভিজ্ঞতা ও সময় দিতে পারে, তাদেরকে মূল্য দিন।

আপনি যদি কোনো প্রযুক্তির মান নির্ধারক সংস্থার সাথে যুক্ত থাকেন:

  • ভাষার মানদন্ড কতটা প্রেক্ষাপট-সমৃদ্ধ হওয়া দরকার তা উপলব্ধি করুন।
  • প্রান্তিক ভাষা সম্প্রদায়গুলির সঙ্গে আরও ভালো সম্পর্ক এবং প্রক্রিয়া গড়ে তুলুন, যাতে আরও বেশি স্ট্যান্ডার্ড যদি সেই সম্প্রদায়ের নেতৃত্বে না-ও আসে, যেন সম্প্রদায়ের অংশীদার হতে পারে।
  • সচেতন ভাবে প্রান্তিক ভাষা সম্প্রদায়ের আরো বেশি সদস্যদের পরিচালন ব্যবস্থায় অংশ নিতে আহ্বান করুন, এবং তাদের পরিপূর্ণ অংশগ্রহণের জন্য প্রয়োজনীয় রিসোর্স দিন।

আপনি যদি সরকারের সঙ্গে যুক্ত থাকেন:

  • মাথায় রাখুন, আপনার নাগরিকদের ভাষায় কন্টেন্ট সকলের জন্য সুগম হওয়া দরকার, কেবলমাত্র কিছু সুবিধাপ্রাপ্ত সংখ্যালঘুদের জন্য নয়।
  • আপনার এলাকায় যারা প্রান্তিক বা বৈষম্যের শিকার, আপনার ভাষায় তাদের থেকে এবং তাদের জন্য কন্টেন্ট সম্প্রসারণে সহায়তা করুন।
  • শুধুমাত্র প্রভাবশালী ভাষাগুলি নয়, আপনার অঞ্চলে প্রান্তিক ভাষাগুলির সংরক্ষণ ও ডিজিটাইজেশনের কাজকে সমর্থন করুন।

আপনি যদি বিনামূল্যের ও মুক্ত উৎসের প্রযুক্তি এবং মুক্ত জ্ঞানের উদ্যোগের সঙ্গে জড়িত থাকেন:

  • উপলব্ধি করুন যে বিনামূল্যের এবং মুক্ত উৎসের প্রযুক্তি ও জ্ঞান সর্বজনীন মঙ্গলের জন্য হলেও এর নিজস্ব ক্ষমতার অসাম্য এবং সীমাবদ্ধতা রয়েছে।
  • প্রান্তিক সম্প্রদায়গুলি তাদের জ্ঞান ভাগ করে নেওয়ার ক্ষেত্রে যে সীমানা নির্ধারণ করে —তার প্রতি শ্রদ্ধাশীল হোন, কারণ অতীতে তাদের জ্ঞানগুলি ঐতিহাসিকভাবে শোষিত ও পণ্যায়িত হয়েছে।
  • আপনার মতে তাদের কী প্রয়োজন -তা করার বদলে, প্রান্তিক ভাষাগোষ্ঠীগুলির প্রয়োজনীয় জ্ঞান ও প্রযুক্তি তৈরি করার জন্য তাদের সঙ্গে সম্মিলিতভাবে কাজ করুন।

আপনি যদি কোনো গ্ল্যাম (গ্যালারি, পাঠাগার, মহাফেজখানা, সংগ্রহশালা এবং স্মৃতি) সংস্থার সঙ্গে যুক্ত থাকেন:

  • উপলব্ধি করুন যে, জ্ঞান এবং সংস্কৃতির যা যা আপনি চয়ন করছেন, সংরক্ষণ করছেন এবং প্রদর্শন করছেন, তার কেন্দ্রে আছে ভাষা।
  • প্রান্তিক ভাষা-সম্প্রদায়গুলির সঙ্গে এমনভাবে কাজ করুন, যাতে আপনি যেভাবে তাদের উৎস চিহ্নিত করেন (বা উপাদানের মালিকানা ও অবস্থান) তার মধ্য দিয়ে তাদের ইতিহাস ও ভাষাগুলি সমর্থিত হয়, স্বীকৃত হয় এবং তারা যেভাবে চান সেভাবে বিস্তৃত হয়। প্রান্তিক জনগোষ্ঠীর কিছু জ্ঞান ও সামগ্রী ভাগ করে নিতে না চাওয়ার অধিকারও এর মধ্যে রয়েছে। এটা গুরুত্বপূর্ণ, কারণ বিশেষ করে গ্লোবাল নর্থে, বহু গ্ল্যাম(GLAM) প্রতিষ্ঠানের মূলে রয়েছে ঔপনিবেশিকতা ও পুঁজিবাদের জটিল ইতিহাস।
  • নিশ্চিত করুন যে, যেসব ভাষা সামগ্রী আপনাদের সংগ্রহে আছে, সেগুলি যাতে সহজে ও বিনামূল্যে প্রান্তিক সম্প্রদায়গুলি এবং তাদের সহযোগীদের কাছে উপলব্ধ হয়, যাতে আমরা একসঙ্গে একটি ভাষার পরিকাঠামো গড়ে তুলতে পারি।

আপনি যদি শিক্ষাসংক্রান্ত কাজের সঙ্গে যুক্ত থাকেন:

  • আমাদের শিক্ষাব্যবস্থা নির্দিষ্ট কিছু ভাষা ও লিখিত উৎসের প্রতি কতটা পক্ষপাতদুষ্ট, তা উপলব্ধি করুন।
  • বিভিন্ন ভাষা, ভাষার বিভিন্ন রূপ এবং তারা যে জ্ঞানকে ধারণ করে থাকে —সেগুলিকে অন্তর্ভুক্ত করার জন্য আপনার শেখানোর ও শেখার উপায়গুলিকে প্রসারিত করুন।
  • যেখানে সম্ভব অনূদিত কাজ পড়ুন, শুনুন এবং উদ্ধৃত করুন, সেইসঙ্গে বাকিদেরও তা করতে উৎসাহিত করুন।

আপনি যদি প্রকাশনা সংক্রান্ত কাজের সঙ্গে যুক্ত থাকেন:

  • বর্তমানে বিশ্বের অধিকাংশ প্রকাশনা কীভাবে ইউরোপীয় ঔপনিবেশিক ভাষার দিকে ঝুঁকে আছে তা উপলব্ধি করুন।
  • আপনি যতগুলি ভাষায় প্রকাশ করেন, তার সংখ্যা আরো বাড়ান, এবং এই ভাষাগুলিতে ডিজিটাইজ করুন।
  • আরো বেশি বহুভাষিক বইপত্র ও অন্যান্য নথি প্রকাশ করুন।
  • বিভিন্ন প্রকার প্রকাশনার ধরণগুলি পরখ করে দেখুন, যাতে মৌখিক, দৃশ্য এবং পাঠ্য ভাষার বিভিন্ন রূপগুলি একইসঙ্গে আরো সহজে ভাগ করে নেওয়া যায়।
  • আপনার অনুবাদকদের সম্মান ও স্বীকৃতি দিন।

আপনি যদি জনসেবামূলক কাজে যুক্ত থাকেন:

  • আপনি যে-খাতেই টাকা ঢালুন না কেন, মাথায় রাখুন, মানুষের সমস্ত ধরণের দক্ষতা, অভিজ্ঞতা ও জ্ঞানের কেন্দ্রে আছে ভাষা।
  • যেসব আন্তর্জাতিক ও আঞ্চলিক অনুষ্ঠান এবং সমাবেশ আপনার আর্থিক সহায়তা পায়, সেগুলি যাতে বিভিন্ন ভাষায় অনূদিত হয় তা নিশ্চিত করুন।
  • আপনি যে সম্প্রদায়গুলির সঙ্গে কাজ করেন, তাদের ভাষায় বিভিন্ন উপকরণের উৎপাদন, সংরক্ষণ ও ডিজিটাইজেশনের কাজকে সমর্থন করুন, এবং আপনার নিজস্ব উপকরণগুলিও যাতে তাদের ভাষায় হয় তা নিশ্চিত করুন।

যদি আপনি কোনো প্রান্তিক ভাষাগোষ্ঠীর সদস্য হন:

  • মাথায় রাখুন যে আপনি একা নন।
  • জেনে রাখুন যে বিশ্বের সাথে আপনি কোন জ্ঞান ভাগ করে নিতে চাইবেন, এবং কীভাবে চাইবেন —সে বিষয়ে সিদ্ধান্ত নেওয়ার অধিকার আপনার সম্প্রদায়ের রয়েছে।
  • এই জ্ঞান সংগ্রহ করতে ও ভাগ করে নিতে আপনার নিজের সম্প্রদায়ের প্রবীণ, বিদ্বান ও তরুণ প্রজন্মের পাশাপাশি অন্যান্য সম্প্রদায়ের বন্ধুদের সঙ্গেও কাজ করুন।
  • আপনি যদি এইধরণের কাজ যারা করে, তাদের সঙ্গে যুক্ত হতে চান, তাহলে আমাদের সঙ্গে যোগাযোগ করুন!

আপনি যদি ভাষাকে ভালোবাসেন, এবং কী করা যায় তাই ভাবছেন:

  • মনে রাখবেন আমরা যা, এবং আমরা যা করি, তার কেন্দ্রে এবং সেইসঙ্গে বিভিন্ন জ্ঞান ও সংস্কৃতির কেন্দ্রে আছে ভাষা —আপনার নিজের ক্ষেত্রেও একথা খাটে।
  • ইংরেজি ও আরো কয়েকটি প্রভাবশালী ভাষা কেন এবং কীভাবে ইন্টারনেট অ্যাকসেস ও কন্টেন্টকে প্রভাবিত করে, ও সবাই মিলে সেটা কীভাবে বদলানো যায় —তা জানতে আপনার পরিবার, বন্ধুবান্ধব ও সম্প্রদায়গুলির সঙ্গে কথা বলুন।
  • প্রান্তিক ভাষা সম্প্রদায়গুলির কন্ট্রিবিউশনগুলি সক্রিয়ভাবে খুঁজুন, পড়ুন, শুনুন এবং তা ভাগ করে নিন (এই প্রতিবেদনটি সহ!)
  • যদি আপনি আমাদের এই উদ্যোগটি থেকে আপডেট পেতে চান, তাহলে সামাজিক মাধ্যমে আমাদের ফলো করুন!

কৃতজ্ঞতা

আমরা বিশ্বজুড়ে সেইসমস্ত বহু প্রান্তিক সম্প্রদায়ের (আদিনিবাসী এবং এর বাইরে) প্রতি ভালোবাসা, শ্রদ্ধা এবং সংহতি জ্ঞাপন করি, যারা ভাষাকে তাদের পরিচিতি ও হয়ে ওঠার মূল হিসেবে দেখেন। এইসমস্ত ভাষা ও অভিব্যক্তির ধরণগুলিকে অর্থপূর্ণ উপায়ে সংরক্ষণ, প্রাণবন্ত ও প্রসারিত করে তুলতে তাদের যে প্রচেষ্টা, —তা আমাদের আরো বহুভাষিক ও বহুমাত্রিক ইন্টারনেটের(ইন্টারনেটগুলির) কল্পনা করতে অনুপ্রাণিত করে; —যেখানে আমরা আমাদের নানা সত্তার মধ্যে পরিপূর্ণ ও সমৃদ্ধ হয়ে উঠতে পারি৷ আমরা সমস্ত সম্প্রদায়ের ও প্রতিষ্ঠানের স্কলার এবং প্রযুক্তিবিদদের কাছেও গভীরভাবে কৃতজ্ঞ, যারা আমাদের মতই ভাষাকে ভালোবাসেন, এবং ইন্টারনেটকে আমাদের বাস্তব জগতের মত বহুভাষিক করে তুলতে প্রতিদিন কঠোর পরিশ্রম করেন।

বিশ্বজুড়ে আমাদের সেইসব কন্ট্রিবিউটর, অনুবাদক, এবং সম্প্রদায়গুলির (বিশেষ করে যাঁরা আমাদের ২০১৯ সালে ইন্টারনেটের ভাষাগুলির ঔপনিবেশকতা-মুক্তকরণ আলোচনা -তে যোগ দিয়েছিলেন, তাঁদের) প্রতি: আপনারা যা, এবং আপনারা যা করেন, তার জন্য আপনাদের ধন্যবাদ, সেইসঙ্গে গত দু-বছর ধরে আমরা যখন টিঁকে থাকার চেষ্টা করে গেছি, তখন আমাদের সঙ্গে ধৈর্য্য ধরে থাকার জন্যও। বিশেষ করে ধন্যবাদ জানাই আমাদের অলংকরণকারীকে, নিবন্ধগুলির সৃজনশীল দৃশ্যায়নের জন্য, এবং আমাদের অ্যানিমেটরকে ধন্যবাদ, যিনি এই অলঙ্করণগুলির প্রাণায়ন করে আমাদের উপহার দিয়েছেন।

আমাদের সেইসমস্ত বন্ধু ও সম্প্রদায়ের প্রতি আমরা খুবই কৃতজ্ঞ, যাঁরা বিভিন্ন ভাষায়, এবং বিভিন্ন দৃষ্টিকোণ থেকে আমাদের কাজকে পর্যালোচনা করেছেন। সমস্ত ভুল আমাদের, কিন্তু আপনাদের সহযোগিতা ও সমর্থন এই বিবর্তমান কাজটিকে আরো ভালো করে তুলতে সাহায্য করেছে। এবং পরিশেষে, আমাদের প্রত্যেকের এবং আমাদের জন্মগত ও পছন্দগত পরিবারের প্রতি: আমরা শেষ কয়েকটি বছর (বিশেষ করে ২০১৯-২১) পার করতে পারতাম না, যদি না আমরা একে অপরের সঙ্গে ঘনিষ্ঠভাবে জড়িয়ে থাকতাম (এমনকি শুধুমাত্র ভার্চুয়ালি পাশে থাকলেও)। ভালোবাসা এবং বিশ্বাস সবচেয়ে শ্রেষ্ঠ ভাষা।

সংজ্ঞা

ভাষার বিভিন্ন দিক ও আমরা যে ইতিহাসগুলিকে নিয়ে আলোচনা করছি, তাকে সংজ্ঞায়িত করার নানা পদ্ধতি আছে। এই সংজ্ঞার সবগুলি একটি অপরটির সঙ্গে সম্মত না-ও হতে পারে! আমরা এই প্রতিবেদন জুড়ে নির্দিষ্ট কিছু শব্দ ও শব্দবন্ধ বিশেষভাবে ব্যবহার করেছি। আমাদের সেইসব মূল শব্দ ও শব্দবন্ধগুলির সংজ্ঞা এখানে দেওয়া হল।

  • প্রভাবশালী ভাষা: যে ভাষাগুলি হয় একটি নির্দিষ্ট এলাকার সংখ্যাগরিষ্ঠ জনগোষ্ঠীর কথা বলার ভাষা, নাহয় যেগুলি আইনি, রাজনৈতিক বা সাংস্কৃতিক শক্তির মত ঐতিহাসিক শক্তি ও বৈধতার নির্দিষ্ট রূপের মাধ্যমে আধিপত্য বিস্তার করে। উদাহরণস্বরূপ, দক্ষিণ এশিয়ার অন্য অনেক ভাষার তুলনায় হিন্দি একটি প্রভাবশালী ভাষা, বিশেষ করে, হিন্দি নিজেই যখন একটি ভাষা পরিবার, বা কেউ কেউ বলেন “উপভাষা”। একইরকমভাবে, চীনের অন্যান্য দেশীয় ভাষা বা চীনা ভাষার অন্যান্য রূপগুলির তুলনায় ম্যান্ডারিন চীনা —সরকারি নীতির মাধ্যমে, সে-দেশের একটি প্রভাবশালী ভাষায় পরিণত হয়েছে। বেশ কিছু প্রভাবশালী ভাষা আবার কোনো দেশ বা অঞ্চলের “জাতীয়” বা “কার্যকরী” ভাষাও বটে।
  • ইউরোপীয় ঔপনিবেশিক ভাষা: পশ্চিম ইউরোপের ভাষা, যা পশ্চিম ইউরোপীয় বিভিন্ন সংস্থা ও সরকার দ্বারা উপনিবেশ স্থাপন প্রক্রিয়ার মাধ্যমে ১৬ শতকের পর থেকে আফ্রিকা, এশিয়া, আমেরিকা, ক্যারিবিয়ান এবং প্রশান্ত মহাসাগরীয় দ্বীপপুঞ্জ জুড়ে ছড়িয়ে পড়ে। এই ভাষাগুলির মধ্যে রয়েছে ইংরেজি, স্পেনীয়, ফরাসি, পর্তুগীজ, ডাচ এবং জার্মান। লক্ষণীয় যে, এই ভাষাগুলি শুধুমাত্র লাতিন আমেরিকা (মধ্য ও দক্ষিণ আমেরিকা) নয়, উত্তর আমেরিকার দেশীয় জনগোষ্ঠীগুলির কাছেও “উপনিবেশকারী”-দের ভাষা ছিল।
  • গ্লোবাল সাউথ এবং গ্লোবাল নর্থ: “গ্লোবাল সাউথ” শব্দবন্ধটি আফ্রিকা, এশিয়া, লাতিন আমেরিকা, এবং ক্যারিবিয়ান ও প্রশান্ত মহাসাগরীয় দ্বীপপুঞ্জের অঞ্চলগুলিকে বোঝায়, যেগুলি পশ্চিম ইউরোপীয় দেশগুলির উপনিবেশ ছিল। এটি ভূগোলের কোনো পরিভাষা হিসেবে বোঝানো হয় না৷ বরং, এর দ্বারা ঐতিহাসিক ও চলমান আর্থ-সামাজিক ও রাজনৈতিক পরিস্থিতিকে বোঝানো হয়, যা এই দেশ ও অঞ্চলগুলির বৈশিষ্ট্য, এবং যা এই অঞ্চলগুলিকে ইউরোপ ও উত্তর আমেরিকার সুবিধাভোগী দেশগুলি বা “গ্লোবাল নর্থ” থেকে পৃথক করে। এটি গ্লোবাল সাউথের অধিকার-আন্দোলন কর্মী ও স্কলারদের তৈরি করা ও প্রচার করা শব্দবন্ধ, যার মধ্য দিয়ে “অনুন্নত”, “উন্নয়নশীল” ও “তৃতীয় বিশ্ব” -এর মত শব্দবন্ধ, যেগুলিকে নিন্দাসূচক ও অবাঞ্ছিত বলে তারা মনে করেছেন, সেগুলিকে কাটিয়ে ওঠার চেষ্টা করেছেন। যেহেতু ঔপনিবেশিকরণের ফলে গ্লোবাল নর্থে বহু আদিবাসী জনগোষ্ঠী গণহত্যা বা ধ্বংসের শিকার হয়েছিল, এবং যেহেতু গ্লোবাল সাউথের কিছু ব্যক্তি ও সম্প্রদায়ও তাদের নিজেদের জনগণের ঔপনিবেশিকরণে অংশ নিয়েছিল, ও সেখান থেকে লাভ করেছিল, তাই আমরা কখনও কখনও বলে থাকি যে গ্লোবাল নর্থের মধ্যেও তাদের নিজস্ব গ্লোবাল সাউথ আছে, আবার গ্লোবাল সাউথের মধ্যেও তাদের নিজস্ব গ্লোবাল নর্থ আছে। এই কাঠামো ও প্রক্রিয়াগুলি এই অঞ্চলগুলির ভাষার অবস্থানকেও প্রভাবিত করে। (“মাইনরিটাইজড মেজরিটি -পরিভাষাটি দেখুন)
  • আদিবাসী ভাষা: একটি নির্দিষ্ট অঞ্চল বা স্থানের আদিবাসী জনজাতির কথা বলার ভাষাগুলি হল আদিবাসী ভাষা। আদিবাসীদের “আদি মানুষজন” বা পৃথিবী জুড়ে বিভিন্ন জায়গার আদি বাসিন্দা হিসেবে দেখা হয়, যে জায়গাগুলির পরবর্তীকালে ঔপনিবেশিকরণ ঘটে, এবং ভিন্ন কোনো সাংস্কৃতিক গোষ্ঠী সেখানে বসবাস শুরু করে। বিশ্বের ৭০০০-এরও বেশি ভাষার অধিকাংশই আদিবাসী জনগোষ্ঠীর লোকেরা ব্যবহার করেন।
  • ভাষা ও উপভাষা: আমরা মানুষের মধ্যে প্রকাশের যে-কোনো কাঠামোগত পদ্ধতিকে ভাষা হিসেবে বিবেচনা করি, তা কণ্ঠস্বর, শব্দ, সঙ্কেত, অঙ্গভঙ্গি বা লেখা হতে পারে। যা শুনে একই ভাষার বিভিন্ন প্রকার বৈচিত্র্য বলে মনে হয়, তাকে কিছু ভাষাতাত্ত্বিক “উপভাষা” হিসেবে সংজ্ঞায়িত করেছেন, কিন্তু সেটা বোধহয় “পারস্পরিক বোধগম্য” হতে পারে —যা এই বিভিন্ন বৈচিত্র্যের সকল ভাষাভাষীই বুঝতে পারেন, এবং তারপর নিজেদের মধ্যে কথাবার্তা বলতে পারেন। যাইহোক, যেহেতু “ভাষা” এবং “উপভাষা” -এর মধ্যে পার্থক্য সংজ্ঞায়িত করার প্রক্রিয়াটি সাধারণতঃ ক্ষমতা ও সুবিধার ঐতিহাসিক প্রক্রিয়াগুলির উপর ভিত্তি করে গড়ে ওঠা একটি রাজনৈতিক (ভাষাগত হওয়ার পরিবর্তে) পছন্দ, তাই আমরা উপভাষা —এই পরিভাষাটি এই প্রতিবেদনে খুব কমই ব্যবহার করেছি। আমরা “ভাষা পরিবার” শব্দবন্ধটি ব্যবহার করতে পছন্দ করি, যা দেখায় যে এমন অনেক ভাষা রয়েছে যেগুলির একই ইতিহাস থাকতে পারে, কিন্তু তাদের আলাদা বৈশিষ্ট্যও রয়েছে, আরবি, চীনা বা হিন্দি ভাষার পরিবারের মত।
  • আঞ্চলিক ভাষা: এই প্রতিবেদনে, আমরা স্থানীয় বা আঞ্চলিক ভাষা হিসেবে সংজ্ঞায়িত করেছি সেই ভাষাগুলিকে, যেগুলি কোনো দেশ বা অঞ্চলে সর্বাধিক সংখ্যক লোকের কথ্য ভাষা।
  • প্রান্তিক ভাষা: বর্তমান প্রতিবেদনে, প্রান্তিক ভাষা হল সেই ভাষাগুলি, যেগুলি ইন্টারনেটে ভাষা সাপোর্ট বা কনটেন্টের, অর্থাৎ সেই ভাষায় লভ্য তথ্য ও জ্ঞানের নিরীখে প্রকট নয়। জনসংখ্যা বা বক্তাদের সংখ্যার পরিবর্তে, এই ভাষাগুলি প্রান্তিক হয়েছে পুঁজিবাদ এবং ঔপনিবেশিকরণ সহ ক্ষমতা ও সুবিধার ঐতিহাসিক ও চলমান কাঠামো দ্বারা। কিছু প্রান্তিক ভাষা ইতোমধ্যেই বিশ্বে বিপন্ন (অনেক আদিবাসী ভাষার মতো)। কিন্তু কিছু কিছু প্রান্তিক ভাষা এখনও তাদের অঞ্চল, বা বিশ্বের উল্লেখযোগ্যভাবে সংখ্যাগরিষ্ঠ লোকের কথ্য, কিন্তু তবুও অনলাইনে তাদের প্রতিনিধিত্ব অনেক কম (যেমন, পাঞ্জাবি ও তামিল, বা হাউসা ও জুলু —এশিয়া ও আফ্রিকার এমনই কয়েকটা প্রভাবশালী ভাষার উদাহরণ)।
  • সংখ্যালঘু এবং সংখ্যাগরিষ্ঠ ভাষা: সংখ্যালঘু ভাষা সেইগুলি, কোনো বর্ণিত অঞ্চলে যেগুলি জনসংখ্যার একটি সংখ্যালঘু অংশের (সংখ্যার পরিপ্রেক্ষিতে) দ্বারা কথিত, এবং সংখ্যাগরিষ্ঠ ভাষা হল সেই জনসংখ্যার সংখ্যাগরিষ্ঠ অংশের (সংখ্যার পরিপ্রেক্ষিতে) কথিত ভাষা।
  • মাইনরিটাইজড মেজরিটি: ক্ষমতা এবং সুবিধার ঐতিহাসিক ও চলমান কাঠামোর ফলে বিশ্বজুড়ে বিভিন্ন সম্প্রদায় এবং জনগণের ওপর বৈষম্য ও নিপীড়ন ঘটে। ক্ষমতা এবং সুবিধার এই রূপগুলি প্রায়ই আন্তঃসম্পর্কযুক্ত হয়, ফলে কিছু সম্প্রদায় একাধিক উপায়ে সুবিধাবঞ্চিত বা নিপীড়িত হয়: উদাহরণস্বরূপ, লিঙ্গ, জাতি, যৌনতা, শ্রেণী, বর্ণ, ধর্ম, অঞ্চল, সক্ষমতা এবং অবশ্যই ভাষার কারণে। অনলাইন হোক বা পার্থিব জগতে, এই সম্প্রদায়গুলিই জনসংখ্যা বা সংখ্যা অনুসারে বিশ্বে সংখ্যাগরিষ্ঠ, কিন্তু প্রায়ই তারা ক্ষমতাসীন অবস্থানে থাকেন না, ফলে তাদের সঙ্গে সংখ্যালঘুর মতো আচরণ করা হয়। অন্য কথায়, তারা “বিশ্বের সংখ্যালঘু হয়ে থাকা সংখ্যাগরিষ্ঠ”।

আরও জানুন, কীভাবে এই প্রতিবেদনটি উদ্ধৃত করবেন।

আরও জানুন, আমাদের সম্পদ এবং অনুপ্রেরণা সম্পর্কে।

এই প্রতিবেদনটি ডাউনলোড করুন (পিডিএফ 2.5 MB)।