Xin chào ! Nếu đây là lần đầu tiên bạn đến với diễn đàn, xin vui lòng danh ra một phút bấm vào đây để đăng kí và tham gia thảo luận cùng VnPro.

Announcement

Collapse
No announcement yet.

Ai ops

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Ai ops

    AIOps: Trí Tuệ Nhân Tạo Có Thể Giúp Gì Cho Dân IT Như Chúng Ta?
    “WIIFM – What’s In It For Me?”
    Một câu hỏi kinh điển và rất đáng giá. Dù bạn là kỹ sư vận hành, quản trị viên mạng hay CIO đang cân nhắc đầu tư, câu hỏi đó vẫn luôn đúng: Tại sao tôi nên quan tâm đến AIOps?

    Thực ra, có cả tá lý do. Và với kinh nghiệm lăn lộn nhiều năm trong lĩnh vực IT, mình thấy AIOps không chỉ là xu hướng, mà còn là vũ khí thật sự nếu được dùng đúng cách.

    📡 Mạng hiện đại tạo ra khối dữ liệu khổng lồ – và bạn không thể đọc hết chúng
    Log, chỉ số đo lường, cảnh báo – từ thiết bị mạng, ứng dụng, WiFi, cloud, bảo mật, máy chủ... đủ để bạn chết chìm trong dữ liệu. Đó chính là lúc AI có thể vào cuộc.

    💡 AIOps có thể làm gì cho bạn?
    1. Lọc nhiễu, tìm điểm nóng
    AI có thể giúp bạn bỏ qua hàng ngàn dòng log tào lao, chỉ giữ lại những cảnh báo thực sự quan trọng.
    2. Liên kết các sự kiện – hiểu chuyện gì đang thực sự xảy ra
    Ví dụ: thiết bị A chết kéo theo ứng dụng B đứng hình. Chuyện thường ngày, nhưng phải có khả năng phân tích phụ thuộc thì bạn mới nhận ra.
    3. Tương quan theo thời gian – không còn mù mờ
    Bạn có thể biết tất cả những gì diễn ra cùng lúc với một sự cố. Từ đó truy vết ngược lại nguyên nhân gốc.
    4. Tìm bất thường bằng thống kê thông minh
    Không chỉ “ngưỡng vượt quá” đơn giản, mà là các phân tích kiểu “trong 30 ngày qua, chỉ số X vào giờ này chưa từng vượt mức Y”.
    5. Dự đoán phần cứng sắp hỏng
    AI có thể học từ hàng triệu dữ liệu để nói với bạn: thiết bị kia đang có dấu hiệu giống 500 thiết bị khác đã chết trước đó.
    6. Đề xuất cách xử lý từng loại lỗi
    AIOps có thể học từ lịch sử: khi triệu chứng A xuất hiện, hành động B đã từng xử lý thành công. Giờ thì đề xuất luôn.

    🤔 Còn gì nữa? Một vài khả năng… đáng ngờ hơn
    • LLM, chatbot, báo cáo tự nhiên: tiện đấy, nhưng đừng quá tin. Mình chưa sẵn sàng giao vận hành mạng cho một con AI nói sai mà nghe có vẻ rất đúng.
    • Tự động cấu hình: hơi nguy hiểm. “Auto” mà thiếu chi tiết thì hỏng hết.
    • So sánh cấu hình giữa thiết bị: tính năng hữu ích, nhưng không phải “wow” lắm.

    🧠 Vấn đề không nằm ở công nghệ, mà ở... chọn đúng công cụ
    Mỗi nhà cung cấp đều quảng cáo mình có AIOps. Câu hỏi là: ai làm tốt thật, ai chỉ đang “AI-washing”?
    Đó là lúc bạn cần đào sâu – tìm hiểu khả năng thật sự, các trường hợp sử dụng, hạn chế, cách tích hợp...


    🛠️ Mua sẵn hay tự làm?
    Các “ông lớn” như ServiceNow, Splunk hay Cisco đều đã (hoặc sẽ) tích hợp AIOps. Ưu điểm: mạnh, đầy đủ, tích hợp tốt. Nhược: đắt và khó tùy biến.
    Còn lại là các nhà cung cấp AIOps bên thứ ba – nhanh nhạy hơn, rẻ hơn, nhưng tích hợp đôi khi không suôn sẻ. AppDynamics, MicroFocus, ScienceLogic, BMC Software, Dynatrace, IBM, Broadcom, Aruba, Junipe, Palo Alto Networks. (Và những công ty khác, danh sách này đang quá dài!)
    🔍 Một vài cái tên đáng chú ý
    🌟 Selector.ai – Rất đáng thử!
    • Tiêu biểu cho AIOps hiện đại: lấy log, metrics, sự kiện → chuẩn hóa → tương quan → cảnh báo thông minh.
    • Nhận biết bất thường theo thời gian, không chỉ “vượt ngưỡng”.
    • Giảm số log gửi lên ServiceNow để tiết kiệm phí.
    • Hỗ trợ SlackOps, kiểm tra cấu hình, cảnh báo sức khỏe mạng...
    Cảm giác rất “trúng bài” với môi trường mạng phức tạp.
    🐼 BigPanda
    • Tập trung vào hợp nhất sự kiện và “giảm nhiễu.”
    • Có thể kết nối dữ liệu từ nhiều silo, tự động hóa phản hồi.
    • Hỗ trợ tạo ticket, chat thông báo – hay cho môi trường DevOps đông người.
    🧠 Moogsoft
    • Một trong những công ty tiên phong AIOps.
    • Được Dell mua lại (2023) – dấu hiệu thị trường này đang nóng dần.

    🧭 Kết luận của một người làm IT lâu năm:
    AIOps không phải là giấc mơ viển vông. Nếu bạn chọn đúng công cụ và hiểu rõ dữ liệu mình đang có, AI có thể trở thành trợ lý đắc lực – giúp bạn giảm cảnh báo ảo, phát hiện vấn đề thật và phản ứng nhanh hơn bao giờ hết. Bạn không cần tin ngay. Hãy thử một cái – xem nó có thực sự giúp bạn “dễ thở” hơn không. Có vẻ như Trí tuệ Nhân tạo và Máy học có thể mang lại giá trị lớn như một phần của quá trình xử lý sự kiện/cảnh báo và đo lường của bạn.

    Đặng Quang Minh, CCIEx2#11897 (Enterprise Infrastructure, Wireless), DEVNET, CCSI#31417

    Email : dangquangminh@vnpro.org
    https://www.facebook.com/groups/vietprofessional/
Working...
X