Patricia Cohen, The New York Times, Đăng ngày 3, tháng 12, 2010. Hiếu Tân dịch
Văn học thời đại Victoria được phân tích bằng thống kê với quy trình mới
Nghiên cứu văn học thời đại Victoria đã hấp dẫn một môn khoa học thống kê mới, bởi vậy những kẻ săn lùng dữ liệu tiên phong này ngày nay đang chủ trương một thí nghiệm khác thường trong khoa phân tích thống kê. Tựa sách của mọi cuốn sách nước Anh xuất bản bằng tiếng Anh trong khoảng thế kỷ 19 - chính xác là 1,681,161 cuốn - đang được lướt bằng phương tiện điện tử để lục tìm những từ khóa những câu khóa có thể cho ta một cái nhìn mới mẻ thấu đáo vào các trí tuệ của thời đại Victoria.
Phương pháp nghiên cứu này mới chỉ bộc lộ những khả năng của nó gần đây, nhờ một thế hệ mới các công cụ kỹ thuật số và các cơ sở dữ liệu cực mạnh, là một trong nhiều cách mà công nghệ đang làm biến đổi khoa nghiên cứu văn học, triết học và các lĩnh vực nhân văn khác vốn chưa ôm nổi việc phân tích cần thiết về số lượng trên quy mô lớn.
Dan Cohen và Fred Gibbs, hai nhà lịch sử khoa học tại đại học George Mason là người đã sáng tạo ra dự án này, đến nay đã lập biểu đồ biểu diễn tần suất của hơn hai chục từ - trong đó có Chúa, tình yêu, công việc, khoa học, và công nghiệp - xuất hiện trong các tựa sách từ Cách mạng Pháp 1789 đến đầu Thế chiến Thứ nhất năm 1914. Đối với Cohen, những đường răng cưa sắc nhọn nhảy múa qua các biểu đồ của ông có thể được dùng để khảo nghiệm những niềm tin sâu sắc nhất về những người thuộc thời đại Victoria, giống như niềm tin của họ vào tiến bộ và khoa học. “Chúng tôi cuối cùng đã có thể khảo nghiệm một cách tin cậy những điều khẳng định cơ bản khác nhau đã từng là trung tâm của những công trình nghiên cứu về thời đại Victorra qua nhiều thế hệ.”
Cohen nói rằng ông và Gibbs hy vọng rằng công trình của các ông sẽ được dùng như một kiểu mẫu để các học giả có thể dùng ‘chiếc xe đẩy mua hàng’ của những công cụ kỹ thuật số mới để thử thách các giả thuyết và các cách lý giải đã tồn tại lâu dài trong các khoa học nhân văn.
Một số đồng nghiệp của các ông rõ ràng còn băn khoăn về những khả năng này.
“Phản ứng của riêng tôi là hết sức phấn khởi,” Alice Jenkins giáo sư văn học và văn hóa thời đại Victoria ở trường đại học Glasgow nói, ông đã thấy Cohen trình bày các kết quả ban đầu của mình trong một cuộc hội nghị gần đây về thời đại Victoria.
Tuy nhiên cũng có những lo lắng về tiềm năng của các công cụ điện tử có thể làm giản lược văn học và lịch sử thành một chuỗi các con số, vắt ra những chủ đề quan trọng vốn không dễ dàng định lượng.
“Tôi bị kích động và khiếp hãi” Matthew Bevis một giảng viên đại học York ở Britain nói. Ông cũng có mặt trong cuộc hội nghị nói trên. “Cái này không phải chỉ là một công cụ, nó thật sự đang định hướng loại câu hỏi mà một ai đó trong văn học có thể sẽ hỏi.”
“Nên bỏ nó vào một cái hộp có dán nhãn “xử lý cẩn thận”, ông nói thêm.
Những lo ngại như thế không ngăn cản ông Bevis hay các nhà hàn lâm khác trong cử tọa khỏi yêu cầu ông Cohen vận hành một số công cụ tìm kiếm điện tử các từ đặc biệt thích hợp với lĩnh vực nghiên cứu của riêng họ.
Meredith Martin, một phó giáo sư Anh văn đại học Princeton là người đang nghiên cứu lịch sử hình thức thơ, quan tâm đến các thuật ngữ “vận luật” ,“nhịp điệu” và “thể thơ.”
“Tôi thậm chí đã gửi cho ông ấy một email ngay khi ông ấy đang thuyết trình,” bà Martin nói. Bà hình dung ông đang bị ngập trong đống yêu cầu, và “tôi muốn là người ở hàng đầu.”
Công trình nghiên cứu “bố cục lại thời đại Victoria” của các ông Cohen và Gibbs là một trong 12 dự án đại học đoạt giải thưởng mới về các ngành khoa học nhân văn kỹ thuật số do Google sáng lập, giải thưởng này trao tặng tiền cùng với quyền truy cập vào các máy tính mạnh và các cơ sở dữ liệu của công ty này.
Một số học giả cảnh giác với sự kiểm soát mà một tập đoàn như Google có thể áp dụng đối với thông tin kỹ thuật số. Kế hoạch của Google tạo ra một thư viện và kho lưu trữ khổng lồ trên mạng đã làm dấy lên cảnh báo về tiềm năng độc quyền đối với các sách số hóa có thể kéo theo sự định giá nặng đô.
Nhưng Jon Orwant, giám đốc kỹ thuật của mảng Sách, Tạp chí và Bằng sáng chế của Google, nói kế hoạch đó là để tạo nên những bộ sưu tập và các công cụ tìm kiếm có sẵn miễn phí cho các thư viện và các học giả. “Đó là điều mà chắc chắn chúng tôi sẽ làm, và không, nó không đòi hỏi phải trả gì cả,” ông nói.
Một tiêu chuẩn trong việc lựa chọn các dự án để tài trợ, ông nói thêm, là chúng có tạo ra các tập hợp dữ liệu mới và các mã khóa máy tính mới mà các nhà nghiên cứu khác có thể thấy có ích hay không.
Việc khảo sát các tựa sách của các ông Gibbs và Cohen chỉ là bước đột phá ban đầu vào dữ liệu. Bước thứ hai là rà soát toàn bộ các văn bản. Các giáo sư này cũng sẽ có khả năng nhắm vào các chi tiết, các tựa sách và các đoạn văn đặc biệt.
Điểm xuất phát của họ là một công trình trước đây tập trung vào văn bản như một điểm dẫn nhập vào thời đại này: cuốn “Hệ thống Tư tưởng thời Victoria, 1830-1870” của Walter E. Houghton một tác phẩm cột mốc được xuất bản vào năm 1957 đã tạo nên một thế hệ các học giả, ngay cả khi các kết luận của nó bị nghi ngờ. Houghton tìm cách nắm bắt cái mà ông gọi là “ý nghĩa chung” của tư tưởng của giai tầng trung lưu và thượng lưu thời Victoria, một phần bằng cách đọc kỹ rất nhiều văn bản được viết trong thời đại đó và đếm một cách có phương pháp xem những từ nhất định nào đó xuất hiện bao nhiêu lần. Chẳng hạn, việc dùng nhiều lần các từ như “hy vọng”, “ánh sáng”, “ánh nắng” được hiểu như một dấu hiệu của tinh thần lạc quan đang tăng lên trong thời Victoria.
Danh mục các sách đọc của Houghton là khổng lồ, nhưng phương pháp của ông nêu ra các câu hỏi về căn cứ vững chắc của việc ngoại suy thái độ của hàng triệu người từ vài trăm văn bản.