Tài liệu là một phần của cuốn sách “BIG DATA: CÔNG NGHỆ CỐT LÕI TRONG KỶ NGUYÊN SỐ” của Thomas Davenport, do Trần Vân Anh dịch và được xuất bản bởi 1980 Books. Cuốn sách khám phá tầm quan trọng của Dữ liệu lớn (Big Data) trong kỷ nguyên số, xóa bỏ những lầm tưởng và làm nổi bật các cơ hội mà nó mang lại.
Tóm tắt các chương và nội dung chính:
- Chương 1: Tại sao dữ liệu lớn quan trọng với bạn và tổ chức của bạn:
- Tác giả cho rằng thuật ngữ “dữ liệu lớn” bị đặt tên sai vì kích thước không phải là yếu tố quan trọng nhất; thiếu cấu trúc và sự đa dạng mới là thách thức chính.
- Nghiên cứu cho thấy chỉ 0,5% trong số 2,8 zettabyte dữ liệu được phân tích vào năm 2012, với rào cản lớn nhất là việc áp đặt cấu trúc cho dữ liệu.
- Dữ liệu lớn khác biệt với phân tích truyền thống ở loại dữ liệu (không cấu trúc so với cột/hàng), lượng dữ liệu (100 terabyte đến petabyte so với dưới vài chục terabyte), dòng chảy dữ liệu (liên tục so với tĩnh), phương pháp phân tích (học máy so với dựa trên giả thuyết) và mục đích (sản phẩm dựa trên dữ liệu so với hỗ trợ quyết định nội bộ).
- Tác giả dự đoán thuật ngữ “dữ liệu lớn” có thể sẽ không tồn tại lâu do sự không chính xác của nó, nhưng bản thân hiện tượng dữ liệu lớn sẽ tiếp tục phát triển.
- Các nguồn dữ liệu mới như dữ liệu từ mạng xã hội, cảm biến (Internet Vạn vật) và dữ liệu cá nhân (từ các thiết bị theo dõi sức khỏe) đang bùng nổ.
- Các công ty công nghệ lớn như IBM, Microsoft, SAP, HP, EMC, Oracle đang đầu tư mạnh vào dữ liệu lớn, khẳng định tầm quan trọng lâu dài của nó.
- Thách thức lớn nhất là tìm kiếm và đào tạo nhân sự phù hợp – các nhà khoa học dữ liệu – những người có kỹ năng khác biệt so với các nhà phân tích truyền thống.
- Dữ liệu lớn thúc đẩy việc khám phá và thử nghiệm dữ liệu liên tục, tập trung vào thông tin bên ngoài và phát triển sản phẩm/dịch vụ mới thay vì chỉ hỗ trợ quyết định nội bộ.
- Các cơ hội mới: cắt giảm chi phí, cải thiện quyết định (bằng cách bổ sung các nguồn dữ liệu mới vào mô hình dự đoán), và tạo ra các sản phẩm, dịch vụ hấp dẫn cho khách hàng (ví dụ: tính năng “Những người bạn có thể biết” của LinkedIn, “Kết quả nổi bật” của Amadeus, tối ưu hóa hiệu suất thiết bị công nghiệp của GE).
- Những điều chưa biết: tác động đến cấu trúc tổ chức, mối quan hệ khách hàng (sự lo ngại về quyền riêng tư), và tốc độ các nhà quản lý sẽ áp dụng phương hướng mới này.
- Chương 2: Dữ liệu lớn sẽ biến đổi công việc, công ty và ngành của bạn ra sao?
- Chương này tập trung vào các viễn cảnh tương lai về cách dữ liệu lớn sẽ thay đổi các ngành và công việc. Tác giả tin rằng dữ liệu lớn sẽ định hình lại hầu hết mọi ngành, từ vận chuyển, bán hàng, sản xuất, dịch vụ đến các ngành liên quan đến tiền.
- Bốn viễn cảnh tương lai:
- Viễn cảnh về dữ liệu lớn đối với việc công tác: Mô tả một kiến trúc sư CNTT tham dự hội nghị với toàn bộ quy trình đi lại, lịch trình, mời ăn tối và ghi nhận chuyên cần được tự động hóa và tối ưu hóa bằng dữ liệu lớn.
- Viễn cảnh về dữ liệu lớn cho việc quản lý năng lượng: Mô tả một nhà quản lý cơ sở vật chất sử dụng dữ liệu lớn để giám sát và kiểm soát tiêu thụ năng lượng của đội xe, hệ thống HVAC và các thiết bị khác, dẫn đến tiết kiệm năng lượng đáng kể.
- Viễn cảnh về dữ liệu lớn đối với việc phân tích video cho các nhà bán lẻ: Mô tả cách một chuỗi cửa hàng thú cưng sử dụng phân tích video để đếm khách, xác định khách hàng và thú cưng, ghi nhận sản phẩm khách hàng đã xem nhưng không mua, và phát hiện hành vi trộm vặt.
Tóm lại, cuốn sách nhấn mạnh rằng Dữ liệu lớn không chỉ là về quy mô mà còn về tính thiếu cấu trúc, sự đa dạng và tốc độ của dữ liệu, mở ra những cơ hội chưa từng có trong việc ra quyết định, phát triển sản phẩm và dịch vụ, đồng thời đòi hỏi những thay đổi lớn về công nghệ, nhân sự và tư duy quản lý.
Công nghệ thông tin Sách giáo trình
BIG DATA: CÔNG NGHỆ CỐT LÕI TRONG KỶ NGUYÊN SỐ- Ngôn ngữ: Tiếng Việt
