喬叔的 Elastic Stack 專業教育訓練
  • 喬叔的 Elastic Stack 專業教育訓練
  • 🧑關於喬叔 (Joe Wu)
  • Elastic 課程公開班
    • 🎯Elasticsearch 基礎實務班
      • 💯學員課後回饋
    • 🆕Elasticsearch 進階運維班
      • 💯學員課後回饋
    • Elasticsearch 進階開發班
    • Elastic Stack 基礎實務班
    • Elastic Observability 基礎實務班
    • 📩課程許願池
  • 技術分享
    • 📗喬叔帶你上手 Elastic Stack
      • 前言
      • Elastic Cloud 如何建立 Deployment
        • ES Node 的種類
        • 配置的選擇
      • Index 建立前你該知道的
        • ES Index 如何被建立
        • ES 的超前佈署 - Dynamic Mapping
        • ES 的超前佈署 - Index Template
        • ES Index 的別名 (Alias)
        • 管理你的 Index - Kibana Index
      • 管理 Index 的 Best Practices
        • Shard 的數量與 Rollover & Shrink API
        • 三溫暖架構 - Hot Warm Cold Architecture
        • Index Lifecycle Management (ILM)
        • Rollup
        • Transform
        • Snapshot Lifecycle Management (SLM)
        • 總結
      • Elastic Cloud 比免費版還多的功能
        • Elastic Stack 的方案比較與銷售方式
        • Centralized Beats Management
        • Centralized Pipeline Management
        • Watcher
        • Elasticsearch Token Service
        • Multi-stack monitoring & Automatic stack issue alerts
      • 向 App Search 學習怎麼用 Elasticsearch
        • 揭開 App Search 的面紗
        • Engine 的 Index Settings 篇
        • Engine 的 Mapping 篇
        • Engine 的 Search 基礎剖析篇
        • Engine 的 Search 進階剖析篇
      • Elasticsearch 的優化技巧
        • Indexing 索引效能優化
        • Searching 搜尋效能優化
        • Index 的儲存空間最佳化
        • Shard 的最佳化管理
      • 完賽心得
    • 📘喬叔帶你上手 Elastic Stack - 探索與實踐 Observability 系列
      • 前言 & 淺談 Observability
      • Elastic 的 Observability 解決方案
      • Uptime - 掌握系統的生命徵象
        • 我們要觀測的生命徵象是什麼?
        • 使用 Heartbeat 收集系統生命徵象數據
        • 透過 Kibana 觀看心電圖及設定警報
        • 使用合成監控 (Synthetics Monitor) 從使用者情境驗證服務的運作狀態
      • Metrics - 觀察系統的健康指標
        • Metrics 與 Metricbeat 的基本介紹
        • 使用 Metricbeat 掌握 Elastic Stack 的健康狀態
        • 使用 Metricbeat 掌握 Infrastructure 的健康狀態 Host 篇
        • 使用 Metricbeat 掌握 Infrastructure 的健康狀態 Docker 篇
        • 使用 Metricbeat 掌握 Infrastructure 的健康狀態 Kubernetes 篇
        • 使用 Metricbeat 掌握 Infrastructure 的健康狀態 AWS 篇
      • Logs - 挖掘系統內部發生的狀況
        • Logs 與 Filebeat 的基本介紹
        • 使用 Filebeat 應該要了解的設計細節與原理
        • 透過 Filebeat 收集 Elastic Stack 中各種服務的細節資訊
        • 透過 Filebeat 收集 Infrastructure 中各種服務的細節資訊
      • Traces - 觀察應用程式的效能瓶頸
        • Elastic APM 基本介紹
        • 使用 APM-Integratoin-Testing 建立 Elastic APM 的模擬環境
        • 如何在 Kibana 使用 APM UI
        • 使用 APM Server 來收集 APM 數據
        • 透過 APM Agents 收集並傳送後端服務運作的記錄
        • 透過真實使用者監控 (RUM, Real User Monitoring) 來改善使用者體驗
      • 建立結構化的 Log
        • Elastic Common Schema 結構化 Log 的規範
        • Elasticsearch Ingest Pipeline 資料 Index 前的轉換好幫手
          • 基本介紹
          • 各種常用的 Processor
          • Enrich 資料與例外處理
      • 有效的使用 Observability 的資料
        • 透過 Machine Learning 發現異常的問題
        • 使用 Kibana Alerts 主動通知異常狀況
        • 資料的生命週期管理
        • 使用 Elastic Observability 追縱及觀察問題的心得
      • 完賽心得
    • 😀Elasticsearch 技術分享小品
      • 🤖Elastic 與 AI
        • Elasticsearch Inference API 讓我們直接在 ES 裡運用 OpenAI Completion API
    • 🎥線上分享
      • 喬叔 Elasticsearch Index 管理與效能優化技巧
      • Elastic Certification 認證經驗分享
    • 🛠️workshop
      • 如何在 Elasticsearch 實現敏捷的資料建模與管理 @ DevOpsDays 2023
        • 工作坊實作內容
      • Elastic Observability 實作體驗坊 @ DevOpsDays 2022
        • 行前準備
        • 工作坊實作內容
      • 當 Elasticsearch 搜尋引擎遇上 AI @ HelloWordDevConference 2024
        • 投影片
        • Elasticsearch 環境準備
        • Google Colab 環境準備
        • 工作坊操作說明
        • ElasticSearch Relevance Engine (ESRE)
    • ⬆️Elastic Stack 版本升級記錄
      • 🔍Elasticsearch
  • 其他專業服務
    • 👩‍🎓企業包班 | 企業內訓
    • 👨‍💼顧問服務
    • 🈺專案合作
    • 🧩Elastic 授權代理
  • 相關連結
    • Facebook 粉絲頁
Powered by GitBook
On this page
  • 8.7
  • 8.6
  • 8.5
  • 8.4
  • 8.3
  • 8.2
  • 8.1
  • 8.0
  1. 技術分享
  2. Elastic Stack 版本升級記錄

Elasticsearch

主要記錄 基礎實務班 與 進階運維班 有關的內容變化

PreviousElastic Stack 版本升級記錄Next企業包班 | 企業內訓

Last updated 1 year ago

8.7

  • [Transform]

    • Start API 增加 from 的參數。

      • 避免在 search 中使用 range query (now-1d),會影響 search request cache。

    • 新增 _schedule_now API

  • [Cluster] Health API GA _health_report

    • 8.3 之前,endpoint 是 _internal/_health

    • 支援多種 indicator,並且各自擁有自己的健康狀態 (green, yellow, red, unknown)

  • [Ingest Pipeline]

    • 新增 Redact Ingest Processor

      • 從內文中,使用 Grok pattern,將敏感資料給刪除。

  • [Data Stream]

    • GA

    • TSDS - GA

      • 這是在 ILM 中的其中一個 action,就像是 Rollup 一樣的功能,但是能在 ILM 中結合使用,而且能直接使用 _search 使用。

8.6

  • categorize_text aggregation GA. (log 分析的好工具,但是要付費 license 才能用)。

8.5

  • [ILM]

    • no longer rolls over empty indices

    • 新的 Action: downsampling (不同於rollup),只支援 Data Stream 的 TSDS 資料類型。

  • [Data Stream] Introduce TSDS (Time Series Data Stream) (preview)

    • sharding 時,會依時間,將時間相鄰的資料放在同個 shard,並依照時間進行 sorting.

    • 好處是 壓縮率高省儲存成本、執行效率快、能依這種資料結構提供特別的 aggs

    • 因為每個 index 存放特定的時間區段資料,所以要新增較舊的時間的資料 (會落在先前的 index),也能支援! (但要留意 index 不能是 readonly)

  • [Transform]

    • 新增 unattended mode,

  • [Aggregation]

    • Frequent items aggregation (preview)

      • renamed to frequent item sets in 8.7

8.4

  • [ILM]

    • introduce min_ conditions in rollover API & ILM actions

  • [Transform]

    • Infinite and adaptive retries for Transforms

  • [Search] support ANN (Approximate Nearest Neighbor) in _search (preview)

    • 原先是 _knn_search 獨立的 endpoint ,現在移到 _search 之中,成為 knn 獨立的 option。

8.3

  • [Mapping] _source 支援 synthetic 模式

    • 使用 doc_values 來反推,在沒有儲存 _source 的情況下還是能支援 reindex,儲存空間省 70%。

8.2

  • [Mapping]

    • 新增 lookup runtime field (preview)

      • 可以在查詢時動態查找另一個 index 的資料,有點像是 runtime join,要小心效能!

      • 不能在 query 與 aggregation 時使用此 lookup 欄位。

  • [Aggregatin]

    • 新增 random_sampler 支援亂數取樣,特別適用在昂貴的 aggregation 處理時的取樣。

  • [Authentication]

    • 新加 JWT realms support for JWT validation

8.1

  • [Transform]

    • 新增 reset API

8.0

Breaking Changes

  • [Text Analysis]

    • nGram and edgeNGram 改名

      • ngram 與 edge_ngram

  • [ILM]

    • freeze action 沒作用了,freeze API 也被移除。

      • 應自行將 ILM Policy 中的 freeze action 移除。

    • ILM Policy 現在一定要有配合的 snapshot repo 與 SLM policy

  • [Transform]

    • 7.4 版之前建立的 Transform,必須 upgrade (upgrade transform api)

  • [Aggregation]

    • date_histgram aggs 的 interval 已移除

      • 改用 calendar_interval 或 fixed_interval

    • 不能再使用 _id 欄位 (來自昂貴的 fielddata) 在 aggs中

      • 真的要用,只要 docvalues 有 enable,可以 duplicate 到另個欄位 (但 auto-generated ID 不支援)

  • Data Folder Changed

    • 不再支援同時存多個 node 的資料在 data folder 中,只有一份會自動 migrate,存多份要自行在 config 指定好。

  • Cloud Repository Plugin 預設在 ES 裡了。 (azure, gcs, s3)

  • 有些 path 中 type 完全移除了

    • _bulk, _count, _delete_by_query, GET _mapping/field/<field>, _update, _update_by_query

    • 有些常用的有保持 _doc

  • ?local 的參數在 _cat API 的 nodes, shard, indices 都移除了

  • Adaptive Replica Selection 在 _search 與 _get request

    • 之前會優先使用相同 location 的 shard (w/ same awareness attribute values)

    • 8.0 後,預設 Adaptive Replica Selection (參考先前 inter-node 通訊時所使用的時間)

  • transient cluster settings 棄用,以後都用 persistent cluster settings.

  • ./elasticsearch-setup-password 棄用,因為會自動建立,改用 elasticsearch-reset-password

  • 移除 sync_flush,在一般 flush 時就會去計算 sync_id

⬆️
🔍
TSDS(Time Series Data Stream)
Downsampling