Công nghệ và sự phát triển kinh tế học dữ liệu

11:27 13/11/2021

Dữ liệu các nhà kinh tế thu thập được để xử lý và phân tích thường có độ trễ rất lớn. Chẳng hạn đến giữa năm 2008 rồi mà Chủ tịch Hội đồng các nhà tư vấn kinh tế cho Nhà Trắng vẫn bảo “không có dấu hiệu gì cho thấy sẽ có suy thoái kinh tế”! Nay, theo tờ Economist, các nhà kinh tế đang kỳ vọng vào tiến bộ công nghệ giúp họ có ngay dữ liệu theo thời gian thật và từ đó đưa ra các nghiên cứu chính xác hơn, nhờ đó có thể giúp các nhà làm chính sách đưa ra các quyết định kịp thời hơn.

Ba yếu tố đang giúp kinh tế học dữ liệu trở thành mốt thời thượng mà đầu tiên là sự phong phú của dữ liệu có thể thu thập được, lại có liên quan đến các vấn đề cần giải quyết.

Chẳng hạn khi các nhà làm chính sách muốn biết nếu giãn cách thành phố để chống dịch sẽ ảnh hưởng như thế nào đến chi tiêu của người dân, họ sẽ thu thập số liệu chi tiêu qua thẻ tín dụng theo từng giờ, từng ngày. Yếu tố thứ hai là xu hướng nhiều nhà kinh tế sử dụng các nghiên cứu dựa vào dữ liệu sống để tác động lên chính sách nhằm tạo uy tín và ảnh hưởng. Yếu tố thứ ba cho thấy các loại nghiên cứu này không đụng đến các lý thuyết kinh tế nữa để tránh tranh cãi; ai nấy đều dùng dữ liệu để chứng minh cho luận điểm của mình.

Nhờ công nghệ, các nhà kinh tế có thể nắm trong tay những chuỗi dữ liệu rất chi tiết như thông tin mua sắm của người tiêu dùng trên các nền tảng thương mại điện tử. Để phân tích kho tàng dữ liệu khổng lồ này, các nhà kinh tế không thể hoạt động đơn độc như ngày xưa; họ phải lập nên các trung tâm dữ liệu gồm nhiều chuyên gia để sàng lọc dữ liệu.

Chẳng hạn GS. Susan Athey, một người tiên phong trong lĩnh vực ứng dụng công nghệ thông tin vào kinh tế học đang có chừng 20 nhà nghiên cứu làm cho trung tâm dữ liệu của bà đặt tại Đại học Stanford. Thay vì ngồi một mình trong phòng viết các tác phẩm kinh điển như các nhà kinh tế học ngày xưa, những ngôi sao trong làng kinh tế học như GS. Raj Chetty tại Đại học Harvard điều hành các phòng thí nghiệm chuyên chạy chương trình xử lý dữ liệu.

Nắm dữ liệu nhiều nhất là các công ty công nghệ thông tin hay công ty dịch vụ lớn. Visa, MasterCard ghi nhận xu hướng chi tiêu; Apple và Google có hết dữ liệu di chuyển của người dùng điện thoại di động; các công ty bảo vệ biết ai vô ra các tòa nhà; Uber, Grab biết khách đi đâu vào giờ nào; các sàn thương mại điện tử nắm rõ thói quen mua sắm của hàng tỉ người trên toàn thế giới. Nhờ dữ liệu mở do các ngân hàng cung cấp về biến động số dư trên tài khoản, bảng kê thẻ tín dụng (đã xóa thông tin cá nhân), có thể biết ngay người dân đang mở túi tiêu tiền hay siết hầu bao phòng thân.

Họ trả tiền cho công nhân, nhân viên văn phòng để nhận các câu trả lời các câu hỏi về thói quen làm việc để từ đó đưa ra các biện pháp phòng chống dịch tại công ty. Kết quả thu được nhanh chóng làm nhiều người bất ngờ như đến tháng 10-2020 Chính phủ Anh biết được kế hoạch hỗ trợ các tiệm ăn vào tháng 8-2020 rất có thể đã làm các ca nhiễm Covid-19 tăng cao.

Lần đầu tiên dữ liệu sống được đem ra phân tích trong một sự kiện lớn có lẽ là cuộc trưng cầu dân ý về việc nước Anh ra khỏi EU. Cả Chính phủ Anh lẫn nhà đầu tư đều muốn biết hệ quả của việc này trước khi số liệu GDP chính thức được công bố. Họ bèn rà soát mọi dấu hiệu có ý nghĩa như lượng khách đặt bàn tại các tiệm ăn, số lượng các chiến dịch giảm giá của các siêu thị – và sau đó đã đi đến kết luận (sau này cho thấy kết luận đúng) là mặc dù nền kinh tế sẽ chậm lại nhưng không đến nỗi là một thảm họa như nhiều dự báo đã đe dọa.

Đại dịch Covid-19 có tác dụng thúc đẩy việc sử dụng dữ liệu theo thời gian thật vào phân tích kinh tế. Ngay từ đầu dịch Google đã công bố dữ liệu đã xóa thông tin cá nhân về xu hướng di chuyển của người dân tại những địa điểm nhất định. Nhiều nhà phân tích sử dụng kho dữ liệu này để đánh giá từng ngày mức độ nghiêm ngặt của từng đợt cách ly, phong tỏa.

Cục Thống kê Mỹ nhanh chóng đưa ra một khảo sát hàng tuần các hộ gia đình với những câu hỏi cụ thể về tình trạng việc làm, khả năng chi trả tiền thuê nhà… Vào tháng 5-2020, ba nhà kinh tế, Jose Maria Barrero, Nick Bloom và Steven Davis khởi xướng các cuộc khảo sát từng tháng về doanh nghiệp và việc làm.

Tuy nhiên, cũng có nhiều người tỏ vẻ nghi ngờ một ngành kinh tế học chuyên dựa vào dữ liệu bởi dữ liệu thô là một chuyện, phân tích chúng để tìm ra xu hướng hay đi đến một kết luận cụ thể lại là chuyện khác. Nhiều nguồn dữ liệu sống có chất lượng đáng ngờ như dữ liệu đặt bàn tại các tiệm ăn do OpenTable đưa ra được cho là thổi phồng quá mức. Dữ liệu thô chưa chắc đã mang tính đại diện hay không bị thiên kiến so với các khảo sát được thiết kế tốt.

Nhiều hãng lớn sẽ có xu hướng giữ rịt dữ liệu cho riêng mình để nâng cao lợi thế cạnh tranh. Nguy cơ lớn nhất là thái độ quá tin vào dữ liệu rồi tự tin rằng người nắm dữ liệu là người nhìn được vào tương lai và có thể nhào nắn xu hướng kinh tế xã hội theo mong muốn. Nhiều người khác cho rằng nên kết hợp kinh tế học dữ liệu với kinh tế học lý thuyết để hai bên bổ sung cho nhau; bằng không kinh tế học chỉ đi từ thái cực này sang thái cực khác.

PV