বিজ্ঞান ও প্রযুক্তি

ডিএনএ-তে লেখা হবে ডিজিটাল ডেটা

সায়নদীপ গুপ্ত Sep 7, 2021 at 2:27 am বিজ্ঞান ও প্রযুক্তি

রবিবার সকালেই মেজাজটা চটকে গেছে অনিন্দ্যর। কফি হাতে বিছানায় বসে দুটো সেলফি তুলেছিল ইন্সটাগ্রামে দেবে বলে; এডিট করার সময়েই নোটিফিকেশন এসেছে, গুগল ফোটো ফোল্ডার পুরো ভর্তি। এবার বসে বসে পুরনো ছবি ডিলিট করো আর নাহলে টাকা দিয়ে জায়গা কেনো! অসহ্য! ল্যাপটপটাও দিনদিন স্লো হচ্ছে এই ডেটাস্পেসের চক্করে, সাতপাঁচ ভাবতে ভাবতে অনিন্দ্য ঠিক করল একটা নতুন এক্সটার্নাল হার্ড ড্রাইভ কিনেই নেবে। কিন্তু কোনটা, ১ টিবি না ২ টিবি?

অনিন্দ্যর মতো আমাদের সবার এরকম অভিজ্ঞতা অল্প-বিস্তর আছে, তাই না? এই তথ্যের বিস্ফোরণের যুগে ঠিকঠাক একটা ডেটা-স্টোরেজ বা তথ্যভাণ্ডার না থাকা যে কতটা ভোগান্তি তা আমরা ভালোই জানি। রাশি রাশি সিনেমা-গান-ছবি-বই এমনকি দরকারি ডিজিটাল নথিপত্র – সবকিছুই বেড়ে চলে আর কমতে থাকে রাখার জায়গা। সাধারণ মানুষের এই অবস্থা, তাহলে ভাবুন বড় বড় কোম্পানি বা গবেষণাকেন্দ্রের তথ্য রাখতে প্রতিদিন কত জায়গা লাগে! ২০১৮ সালের হিসেব অনুযায়ী, সারা বিশ্বের সর্বমোট ডিজিটাল তথ্যের পরিমাণ প্রায় ২২ ট্রিলিয়ন গিগাবাইট (১ ট্রিলিয়ন = ১০ লক্ষ কোটি, ধাক্কা লাগল?), তাও শুধু ইন্টারনেট ও সরকারি-বেসরকারি ভাণ্ডার মিলিয়ে, আমার-আপনার ব্যক্তিগত সংগ্রহ ধরা নেই। তাই নিত্যনতুন গবেষণায়, বেড়ে চলা তথ্যের বিকল্প সংরক্ষণের খোঁজ চালাচ্ছেন বিজ্ঞানীরা। সেই খোঁজেরই ফসল, ডিএনএ। 

ডিএনএ? মানে সেই কোশের মধ্যে থাকা প্যাঁচানো শৃঙ্খলের মতো জিনিসটা, যার মধ্যে জিন থাকে? একেবারেই তাই, ডি-অক্সিরাইবোনিউক্লিক অ্যাসিড, যে কোনও জীবকোশের সমস্ত তথ্যের চাবিকাঠি। ওই যে জিনের কথা বললেন, ওইটি হচ্ছে শপিং মলের জামার গায়ে থাকা বারকোডের মতো। কোশের ভিতর রাইবোজোম এই কোড স্ক্যান করে বুঝে যায় ঠিক কোন প্রোটিন তৈরি করতে হবে। এমন হাজারো প্রোটিন বিভিন্ন জটিল কাজ করে চলেছে বলেই আমরা আমৃত্যু সচল আছি। তার মানে ডিএনএ আসলে আমাদের কোশের ইন্টার্নাল হার্ড ড্রাইভ। তা এহেন প্রাকৃতিক হার্ডডিস্কে ভরে রাখব গান-সিনেমা-জটিল হিসেবনিকেশ... গল্প, নাকি কল্পবিজ্ঞান?




আজ্ঞে বিজ্ঞান বটে, তবে ‘কল্প’টুকু বাদ। ডিএনএ-র মূল গঠনকারী একক হল চার রকমের ক্ষারক অণু – অ্যাডেনিন (A), গুয়ানিন (G), সাইটোসিন (C) আর থাইমিন (T)। এরা সবাই শর্করা আর ফসফেট অণুর সঙ্গে জোট বেঁধে হয়ে যায় ‘নিউক্লিওটাইড’ আর তারপর একে অন্যের সঙ্গে হাত ধরাধরি করে দ্বিতন্ত্রী ডিএনএ-র অমন সিঁড়ির মতো গড়ন তৈরি করে (উপরের ছবি দ্রষ্টব্য)। A ধরে T-এর হাত, G ধরে C-এর হাত। এইবার ভাবুন, সাধারণ কম্পিউটার তথ্য পড়ে কীভাবে? আপনি দেখছেন মোনালিসার ছবি, কম্পিউটার দেখছে বাইনারি সংকেত, অর্থাৎ গাদাখানেক ১ আর ০-এর নির্দিষ্ট সমাহার। ধরুন, আপনি ‘A’ লিখলে কম্পিউটার বুঝবে ১০০০০০১ আর ‘a’ লিখলে বুঝবে ১১০০০০১ – শুধু দুটো সংখ্যার বিভিন্ন ক্রম সাজিয়ে যদি জটিলতম তথ্য লিখে ফেলা যায়, চারখানা অণু পেলে সুবিধা তো বাড়বে বৈ কমবে না! কিন্তু তাদের কাজে লাগানো হবে কীভাবে? এর জন্য বাইনারি সংকেতকে লিখতে হবে ডিএনএ-র ATGC-সংকেতের ভাষায়। A/G যেহেতু T/C-এর সঙ্গে জুটি বানায়, তাই তাদের দুটো শ্রেণিতে ভাগ করে এক শ্রেণিকে বললাম ‘১’ আর অন্যজনকে বললাম ‘০’, মিলে গেল দুই ভাষা। পুরো পদ্ধতিটা ছবির মাধ্যমে নিচে বোঝানো হল – 




এবার PCR প্রক্রিয়ায় এমন সংকেত-বিশিষ্ট ডিএনএ বানিয়ে ফেলা বিজ্ঞানীদের কাছে মামুলি ব্যাপার। কোভিডের সৌজন্যে এখন PCR সম্পর্কেও আমরা মোটামুটি ধারণা রাখি, কাজেই ওভাবে যে নির্দিষ্ট ক্রমের (sequence) ডিএনএ হাজারে-হাজারে বানিয়ে ফেলা যাবে তাও বুঝতে পারি। বিজ্ঞানীরাও সেইটিই করেছেন। উপরের ছবিতে যেভাবে একটি বাক্যকে তথ্য হিসেবে ডিএনএ-র ভাষায় লিখে ফেলা হল, একই ভাবে আরও অনেক তথ্য লিখে ফেলা সম্ভব। এর সুবিধা? ডিএনএ এক অর্থে অক্ষয়-অমর; উষ্ণতার চরম হেরফেরে তার কিছুই যায়-আসে না, উপরন্তু তথ্য জমানোর পরিসর অকল্পনীয় রকম বেশি। একটা ছোট্ট উদাহরণ দিই, ২০১১ সালে IBM কোম্পানির একটি তথ্যকেন্দ্রের সর্বোচ্চ সংরক্ষণ-ক্ষমতা ছিল ১০০ পেটাবাইটস (১ পেটাবাইট = ১০০০ টেরাবাইটস/টিবি)। অন্যদিকে ১ গ্রাম ডিএনএ-তে সর্বোচ্চ যত তথ্য রাখা যায় তার মান ২০০ পেটাবাইটস! তথ্যকেন্দ্রের খরচও থাকবেনা, সংরক্ষণের সমস্যাও নেই। সাধারণ রেফ্রিজারেটরের সর্বনিম্ন উষ্ণতায় রাখলে ডিএনএ কয়েকশো বছর হেসেখেলে টিকে যাবে। 

আরও পড়ুন: জিন নিয়ে কারিকুরি, খোদার উপর খোদকারি?

এরকম চমৎকার পরিকল্পনার একটা অসুবিধার দিকও আছে – তথ্য তো রাখা হল, কিন্তু প্রতিবার তাকে তুলে আনা যাবে কী করে? আপাতদৃষ্টিতে কাজটা সহজ; ঠিক যেটুকু তথ্য চাই, PCR পদ্ধতির মাধ্যমে ডিএনএ-র সেইটুকু অংশের প্রতিলিপি বানিয়ে ফেলতে হবে। এর জন্য চাই স্বল্প দৈর্ঘ্যের নিউক্লিওটাইড সমষ্টি বা প্রাইমার, যার কাজ হল বিশাল বড় ডিএনএ-র দুইদিকে বসে মাঝের অংশকে প্রতিলিপিকরণের জন্য চিহ্নিত করা। কিন্তু এইভাবে একটা গোটা তথ্যভাণ্ডার থেকে তথ্য খুঁজে বের করা মানে তো খড়ের গাদায় সুচ খোঁজা নয়, একটা খড় খোঁজা! আরও অসুবিধা হল – যত লম্বা ডিএনএ, তার সিন্থেসিস পদ্ধতি ততই খরচসাপেক্ষ। প্রাইমার যদি ভুল জায়গায় বসে তাহলে তো সর্বনাশ; তাছাড়া, উৎসেচক ও অন্যান্য পাঁচমিশালি জিনিস থাকার কারণে, PCR হয়ে গেলে প্রতিলিপিটুকু বাদে বাকি অংশ হয়ে যায় ব্যবহারের অযোগ্য। এইভাবে বিপুল পরিমাণ ডিএনএ নষ্ট হওয়া মানে তথ্য এবং সেই সংক্রান্ত খরচ জলে যাওয়া! সমস্যার সমাধানে এগিয়ে এলেন আমেরিকার দুই প্রান্তের দুইদল বিজ্ঞানী – MIT ও Boise State University – ভিন্ন ভিন্ন গবেষণায় তাঁরা বের করলেন এমন পদ্ধতি যার মাধ্যমে PCR করে প্রতিলিপি বানানোর দরকারই রইল না। 

MIT-র গবেষকরা করলেন কী, একেকটি ডিএনএ ফাইলকে অতিক্ষুদ্র সিলিকা ক্যাপসুলে ভরে ফেললেন। আর প্রতিটি ক্যাপসুলের গায়ে বারকোড হিসেবে বসিয়ে দিলেন আরেকটি ডিএনএ। এবার এই বারকোড পড়ার লেসার-রশ্মির কাজ করবে ফ্লুরোসেন্ট-লেবেল বা ম্যাগনেটিক-লেবেল করা প্রাইমার। তারা নিজেদের নির্দিষ্ট ক্রমের ভিত্তিতে নির্দিষ্ট বারকোডের ক্যাপসুলকেই তুলে আনবে। সেই ক্যাপসুলের ডিএনএ-র ক্রমটুকু পড়ে নিলেই জানা হয়ে যাবে তথ্য। অবশিষ্ট সিলিকা মিশ্রণটি তুলে রাখা হবে যথাস্থানে, তাতে থেকে যাওয়া বাকি তথ্য অনায়াসে আবার ব্যবহার করা যাবে। 

Boise University-এর বিজ্ঞানীরাও কম যান না। তাঁরা বললেন, ক্রমনির্ধারণ ব্যাপারটাই ঝামেলার, তার চাইতে ডিএনএ-কেই এমন ভাবে সাজানো যাক, যাতে তার সজ্জারীতি দেখেই পড়ে ফেলা যায় তথ্য। তৈরি হল ডিএনএ অরিগ্যামি – তথ্যগুলো আলাদা আলাদা একতন্ত্রী ডিএনএ হিসেবে সাজিয়ে ফেলা হল একটা প্ল্যাটফর্মের উপর। এমন করে সাজানো, যাতে প্রতিটা ডিএনএ-তে প্রাইমার আটকানোর বিশেষরকম খাঁজ থাকে অথবা থাকে না। খাঁজ থাকলে সে ‘১’, না থাকলে ‘০’ – সেই বাইনারি পদ্ধতি! এর ফলে ডিএনএ-র সিকুয়েন্স বা ক্রম জানতেও হল না; ফ্লুরোসেন্ট প্রাইমার কোথায় আটকাচ্ছে আর কোথায় আটকাচ্ছে না, সেই তথ্য দিব্যি বাইনারি ভাষায় কম্পিউটারে ফুটে উঠল। 

এই অবধি পড়ে যদি ভাবেন, গবেষণাগারের চৌহদ্দি ছেড়ে বেরোতে এসবের ঢের দেরি, তাহলে ভুলেও সেকথা মুখে আনবেন না। এই লেখা যতক্ষণে আপনি পড়ছেন, তার মধ্যে নেটফ্লিক্সে এসে গেছে জার্মান ধারাবাহিক থ্রিলার ‘বায়োহ্যাকার্স’-এর দ্বিতীয় মরসুম। এই সেরেছে! এসবের মাঝে আবার নেটফ্লিক্স কেন? কারণ, এই সিরিজের প্রথম মরসুমের প্রথম পর্বটি সংরক্ষিত আছে ডিএনএ-র মধ্যে! জেনেটিক প্রযুক্তির নানাবিধ চমৎকার নিয়ে তৈরি এই থ্রিলারের মাধ্যমে বিজ্ঞানের যুগান্তকারী কিছু পরিকল্পনা সম্পর্কে সচেতনতা বাড়ানোর উদ্দেশ্যেই নেটফ্লিক্স গাঁটছড়া বাঁধে প্রোফেসর রবার্ট গ্রাস ও ‘ট্যুইস্ট বায়োসায়েন্স’ সংস্থার সঙ্গে। তাঁদের প্রচেষ্টার ফলে রূপকথা এখন টেস্ট টিউবে। 

আরও পড়ুন: মহাবিশ্বের প্রথম যৌগ এবং মহাজাগতিক রসায়ন

যা ছিল কোশের রুমাল, তা-ই শেষে হল তথ্যপ্রযুক্তির বিড়াল! ওয়াটসন-ক্রিক-ফ্র্যাঙ্কলিনের হাত ধরে ডিএনএ-কে চিনতে শেখার সময় কেউ কি ভাবতে পেরেছিল, সত্তর বছর পার করে তা জড়জগতের সমস্যারও উত্তর হয়ে উঠবে? তবে বিজ্ঞান সব প্রশ্নের শেষ উত্তর দেয় না কখনোই, বরং উপর্যুপরি আরও নতুন প্রশ্নের জন্ম দেয়। হিসেব বলছে, একটা কফি মগের অর্ধেক পরিমাণ ডিএনএ-তেই গোটা দুনিয়ার সব তথ্য ধরে যাবে, কিন্তু এই প্রক্রিয়াকে পুরোদস্তুর কাজে লাগানোর পথে একমাত্র অন্তরায় খরচ। ১০০ পেটাবাইটস ইলেকট্রনিক তথ্যভাণ্ডার গড়তে যা খরচ, এই মুহূর্তে দাঁড়িয়ে ১ পেটাবাইট তথ্য ডিএনএ-তে লিখতে ও পড়তে সেই একই খরচ। তবে কি অধরা থেকে যাবে এমন যুগান্তকারী প্রকল্প? অবশ্যই নয়, এবং সেইখানেই গবেষণা এগিয়ে নিয়ে যাওয়ার আশু প্রয়োজনীয়তা। স্কুলে যখন কম্পিউটার শেখানো প্রথম শুরু হয়, তখনও ১২৮ মেগাবাইটস ফ্লপি ড্রাইভ ছিল বিস্ময়ের জিনিস আর আজ আমরা অনিন্দ্যর মতোই হার্ড ড্রাইভ কিনতে গেলে ভাবি, ১ টিবি না ২ টিবি! বহু বছর ধরে বহু বিজ্ঞানীর নিরলস সাধনা এই সাফল্য এনেছে, তাঁদের হাত ধরেই আগামী সাফল্যও করায়ত্ত হবে। আমরা শুধু ভরসাটুকু রাখি।


তথ্যসূত্র: ১) Random access DNA memory using Boolean search in an archival file storage system, 2021, Nature Materials

২) An alternative approach to nucleic acid memory, 2021, Nature Communications

প্রচ্ছদঋণ: phys.org 

*****


#ডিএনএ # প্রযুক্তি #বাইনারি # রাসায়নিক সংকেত #double helix # DNA #data storage #digital drive # MIT #গবেষণা # নেটফ্লিক্স # বায়োহ্যাকার্স # সায়নদীপ গুপ্ত # সিলি পয়েন্ট # বিজ্ঞান # বাংলা পোর্টাল # ওয়েবজিন #web portal

Leave a comment

All fields are required. Comment will appear after it is approved.

trending posts

newsletter

Connect With Us

today's visitors

7

Unique Visitors

215865