Phát triển cơ sở dữ liệu phục vụ chính sách tài khóa

Theo eFinance

Cơ sở dữ liệu tài chính - ngân sách là một trong bảy cơ sở dữ liệu (CSDL) quốc gia được Chính phủ phê duyệt trong Kế hoạch tổng thể chương trình quốc gia về CNTT theo đề án 112 trước đây. Có thể nói nó là CSDL sớm nhất được xây dựng, phát triển và tồn tại đến ngày nay.

Phát triển cơ sở dữ liệu phục vụ chính sách tài khóa

Nhằm đáp ứng tốt hơn, thiết thực và hiệu quả hơn đối với công tác quản lý, điều hành và hoạch định, điều chỉnh chính sách trong giai đoạn mới, vấn đề đặt ra là phải phát triển và tăng cường khả năng của CSDL này cả về công nghệ, thông tin dữ liệu và khả năng khai thác.

Những vấn đề đặt ra với hệ thống CSDL ngành Tài chính

Qua quá trình hơn 10 năm hình thành và phát triển, có thể đánh giá một cách tổng quát về CSDL quốc gia tài chính ngân sách đã tạo dựng được một môi trường cơ bản về CSDL, trong việc thu thập và cung cấp các thông tin về tài chính ngân sách, đáp ứng một phần nhu cầu quản lý và nghiên cứu hoạch định chính sách của ngành Tài chính. Về mặt công nghệ nó đã khởi đầu và tạo đà cho các bước phát triển tiếp theo.

Trong giai đoạn tới, để tiếp tục phát triển và tổ chức khai thác các CSDL đầy đủ và hiệu quả hơn, thiết thực hơn cho ngành Tài chính, CSDL quốc gia về tài chính ngân sách cần phải được sắp xếp lại một cách hợp lý để đạt ít nhất 2 điều kiện: Tập trung đầy đủ dữ liệu về các lĩnh vực hoạt động của nền tài chính quốc gia, mà trước hết là khu vực tài chính công, cùng các dữ liệu kinh tế xã hội tổng hợp liên quan. Tạo khả năng khai thác tối đa cho người sử dụng.

Tuy nhiên, để sắp xếp lại một cách hợp lý có nhiều vấn đề lớn được đặt ra ở đây: Xác định một cách chính xác, hợp lý các chủ đề cần thiết của hệ thống các cơ sở dữ liệu, gồm cả tổng kho và các CSDL chuyên ngành đã được duyệt vào năm 1998 và sau có điều chỉnh vào năm 2007. Nhưng trong giai đoạn hiện nay cần nghiên cứu lại cho sát nhu cầu thực tế và định hướng phát triển tổng thể các CSDL quốc gia của Nhà nước hơn.

Bên cạnh đó, cần đánh giá, xác định các nhu cầu thông tin cho CSDL quốc gia tài chính ngân sách là gì? Ai cũng nói rất nhiều về nhu cầu thông tin, nhưng nhu cầu cụ thể và tổng hợp lại thì vẫn chưa có đáp án chính thức.

Ngoài ra, giải pháp cho lưu trữ thông tin cũng cần được bàn tới. Hiện nay, xu thế phát triển công nghệ hướng tới là điện toán đám mây và internet di động. Câu hỏi đặt ra là tự tổ chức lưu trữ cho riêng ngành Tài chính? Hay một phần? Hay hoàn toàn qua dịch vụ “đám mây”?. Ứng dụng internet di động như thế nào cho việc gửi thông tin lưu trữ, đặc biệt là từ các vùng sâu, vùng hẻo lánh...

Đối với giải pháp tổ chức khai thác có khá nhiều câu hỏi đặt ra như: Tổ chức môi trường khai thác như thế nào và xây dựng các công cụ hỗ trợ khai thác một cách có hiệu quả nhất? Trong điều kiện phát triển rất đa dạng của các công cụ, đặc biệt là các công cụ sử dụng internet di động? Phương thức phổ thông hiện nay là truy cập trực tiếp, có thể ví như là một kho hàng mà có nhiều người cùng lúc xếp dỡ mua bán, sẽ không thể đủ chỗ? Giải pháp phục vụ, hiện cũng nhiều công ty giới thiệu khả năng ứng dụng BI, nhưng nó cũng còn phụ thuộc vào cả khả năng nguồn dữ liệu thông tin, vào khả năng sử dụng các công cụ đó của người khai thác, cũng như khối lượng người truy cập đồng thời?

Trong khi nhu cầu lưu trữ và khai thác đòi hỏi tăng rất nhanh, thì vấn đề đảm bảo an toàn bảo mật, an minh hệ thống đang ngày càng trở nên bức bách hiện nay, đòi hỏi cả về cơ chế chính sách lẫn giải pháp công nghệ từ tầm vĩ mô đến từng ngành, từng đơn vị.

Các vấn đề về hỗ trợ và đảm bảo kỹ thuật cho vận hành cũng đang là những vấn đề cần được suy xét kỹ, nhất là cơ chế dịch vụ hay phục vụ, quy mô, mức độ thế nào là hợp lý. Cơ chế quản lý và vận hành... sao cho tránh chồng chéo giữa các đơn vị tham gia các hoạt động quản trị và quản lý giữa công nghệ và thông tin...

Định hướng phát triển CSDL

Nguyên tắc xây dựng các kho:Yêu cầu quan trọng nhất đó là kho dữ liệu khi được xây dựng cần phải đảm bảo giải quyết được: Hệ thống sau khi triển khai sẽ có khả năng vận hành tự động, thu thập thông tin từ nhiều nguồn dữ liệu tác nghiệp khác nhau trên các nền tảng công nghệ khác nhau. Hệ thống kho dữ liệu phải đảm bảo lưu trữ và cung cấp số liệu lịch sử lâu dài (khối lượng cực kỳ lớn) phục vụ các công việc so sánh, phân tích, đánh giá… của người dùng.

Hệ thống phải đảm bảo tính sẵn sàng, thuận tiện, nhanh chóng tạo lập các báo cáo đáp ứng sự thay đổi thường xuyên, đa dạng trong quản lý, cũng như dưới nhiều loại hình công nghệ khác nhau (kể cả khai thác qua internet di động). Hệ thống phải có khả năng đảm bảo các yêu cầu về quản lý được người dùng lẫn quản trị hệ thống; đảm bảo an ninh bảo mật của cả hệ thống, cũng như các thông tin dữ liệu đã được lưu trữ và khai thác.

Xác định kho dữ liệu: Hệ thống các kho dữ liệu bao gồm 2 loại:

+ Kho tập trung/tổng kho (common datawarehouse): Đây chính là cơ sở dữ liệu quốc gia, phục vụ cho các nhu cầu khai thác rộng rãi theo yêu cầu chung của Chính phủ.

+ Kho chuyên ngành (profesional database/datawarehousses) gồm: Kho bạc Nhà nước, Thuế, Hải quan, Chứng khoán Nhà nước, Dự trữ quốc gia…

Các địa phương cũng có thể lập các kho riêng phục vụ các nhu cầu riêng của địa phương. Nhưng cần được tổ chức và quản lý theo các nguyên tắc và quy định như đối với kho chuyên ngành. Ở đây tạm coi các kho địa phương cũng là các kho chuyên ngành.

Cách thức xây dựng và quản lý: Các kho/cơ sở dữ liệu chuyên ngành:Do các đơn vị chuyên ngành chủ động xây dựng.Các đơn vị chuyên ngành nếu thấy không nhất thiết và không đủ khả năng tự xây dựng và quản lý riêng kho cho mình, thì các nhu cầu lưu trữ dữ liệu sẽ được lập theo đề án tổng thể và sắp xếp chung thành kho chủ để của tổng kho.

Kho tập trung/tổng kho:Xây dựng tập trung. Tổng kho bao gồm hệ thống các kho chủ đề và môi trường trung gian phục vụ khai thác thông tin. Các kho chủ đề của tổng kho sẽ bao gồm các thông tin có tính chất chung mà thông thường người khai thác hay dùng và sẽ được sắp xếp lại sao cho thuận tiện và đáp ứng được nhu cầu của người khai thác. Nguồn thông tin sẽ tự động cập nhật từ tất cả hệ thống các kho/cơ sở dữ liệu chuyên ngành.Các kho/cơ sở dữ liệu chuyên ngành đã có các đơn vị chuyên ngành xây dựng thì ở tổng kho chỉ là “bản báo cáo tổng hợp” nhằm phục vụ chung.

Nguyên tắc lưu trữ thông tin: Tất cả các thông tin dữ liệu trước khi được “nhập kho” đều phải “làm sạch và gán nhãn”, nhằm tạo tính ổn định và khả năng đáp ứng đa chiều của các hoạt động khai thác sau này. Qua cơ chế loại trừ và kiểm tra dữ liệu đầu vào từ các hệ thống tác nghiệp, giảm tối đa sự không logic phát sinh từ nguồn dữ liệu.

Phân định theo kho:Kho chuyên ngành,lưu trữ các thông tin, dữ liệu phục vụ cho công tác điều hành, quản lý thường xuyên theo nghiệp vụ chuyên ngành.

Nguồn thông tin: Lấy từ các chế độ báo cáo thống kê kế toán và từ các cơ sở dữ liệu tạo bởi các ứng dụng CNTT vào nghiêp vụ; từ các yêu cầu nghiệp vụ thu thập thông tin khác (mua, điều tra…).

Kho chung/tổng kho: Lưu trữ toàn bộ các thông tin mang tính tổng hợp và phổ cập trong sử dụng của các kho chuyên ngành/chủ đề cũng các cơ sở dùng chung để phục vụ cho toàn bộ các nhu cầu của mọi loại đối tượng.

Nguồn thông tin: từ các chế độ báo cáo thống kê kế toán; từ các cơ sở dữ liệu tạo thành bởi các ứng dụng, cùng với thông tin tự động cập nhật từ các kho chuyên ngành và từ các yêu cầu nghiệp vụ thu thập thông tin khác (mua, điều tra, …).

Có môi trường khai thác riêng phục vụ chế độ báo cáo, nghiên cứu…, trong đó bao gồm cả khoảng không gian cùng các công cụ hỗ trợ người khai thác (chẳng hạn BI, các loại báo biểu tổng hợp thông dụng,...).

Việc back up dữ liệu của tất các các loại kho sẽ được thực hiện tự động và trực tiếp đối với Trung tâm dự phòng thảm họa chung của toàn ngành Tài chính (DRC Láng – Hòa lạc). Trước mắt, trong vài năm tới khi Trung tâm này chưa hoàn thành, cần có Trung tâm dự phòng đặt chung cùng với tổng kho dữ liệu toàn ngành. Các cơ sở dữ liệu chuyên ngành sẽ back up vào Trung tâm dự phòng này để giảm bớt mỗi nơi đều cần back up, lãng phí.

Nguyên tắc quan hệ giữa các kho: Các kho chuyên ngành thường xuyên cập nhật, back up thông tin tự động về Trung tâm dự phòng thuộc hệ thống tổng kho. Việc xử lý thông tin đưa vào các kho chủ đề của tổng kho sẽ được thực hiện tự động từ Trung tâm dự phòng.Tổng kho là đầu mối giao dịch với các cơ sở dữ liệu thuộc các ngành khác và các kho quốc gia khác.

Cơ chế tổ chức quản lý và khai thác: Để phục vụ khai thác, tất cả các kho khi xây dựng đều cần tạo môi trường trung gian. Bao gồm cả “khoảng không gian” đủ rộng đáp ứng khối lượng nhu cầu cơ bản, hạn chế khai thác và lưu tại chỗ. Cùng các công cụ hỗ trợ khai thác (đặc biệt phát triển các công cụ tìm kiếm kiếm hỗ trợ tổng hợp và phân tích, BI) và quy chế khai thác thông tin cụ thể, tùy thuộc vào điều kiện và tình hình nhu cầu, yêu cầu quản lý của từng kho.

Người khai thác trực tiếp sẽ được chia thành 2 dạng chính:Đối tượng chung: Chủ yếu chỉ được khai thác thông qua môi trường trung gian (middleware) của tổng kho. Hạn chế tối đa việc cấp quyền khai thác trực tiếp trên các kho chuyên đề chứa dữ liệu gốc.Đối tượng muốn khai thác theo chuyên ngành: Sẽ có cơ chế phân quyền khai thác từ các cơ sở dữ liệu chuyên ngành theo nguyên tắc chỉ được “lấy thông tin ra” chuyển vào môi trường trung gian của tổng kho, hoặc về máy cá nhân để khai thác mà “không được hoạt động phân tích tại chỗ”.

Phục vụ lãnh đạo và điều hành, hoạch định chính sách: thực hiện xây dựng chế độ các báo cáo theo yêu cầu. Khi cần phục vụ theo chuyên đề/đề tài nghiên cứu sâu: sẽ sử dụng cơ chế dịch vụ hỗ trợ, cung cấp thông tin.

Cục Tin học và Thống kê tài chính là đơn vị chịu trách nhiệm chủ trì tổ chức quản trị hệ thống các CSDL này, đảm bảo an ninh bảo mật hệ thống và thông tin dữ liệu và trực tiếp quản lý và quản trị đối với tổng kho của Bộ Tài chính và DRC. Hướng dẫn các phân hệ, các đơn vị thưc hiện quản lý và quản trị các CSDL chuyên ngành. Đối với các đơn vị không thể tự quản trị CSDL riêng sẽ do Cục Tin học và Thống kê tài chính quản trị hộ, còn dữ liệu phải do đơn vị tự quản lý.Việc kết nối theo mạng các CSDL quốc gia chung sẽ được thực hiện tại tổng kho. Các kho dữ liệu chuyên ngành sẽ kết nối với tổng kho.