Welcome to Stack Simplify

Kalyan Reddy Daida · Kalyan Reddy Daida · commit c3fbf5490a66 · 2020-07-18T11:58:39.000+05:30
diff --git a/18-EKS-Monitoring-using-CloudWatch-Container-Insights/README.md b/18-EKS-Monitoring-using-CloudWatch-Container-Insights/README.md
@@ -60,13 +60,100 @@ kubectl run --generator=run-pod/v1 apache-bench -i --tty --rm --image=httpd -- a
 
 ## Step-07: CloudWatch Log Insights
 - View Container logs
+- View Container Performance Logs
 
+## Step-08: Container Insights  - Log Insights in depth
+- Log Groups
+- Log Insights
+- Create Dashboard
 
-## Step-08: CloudWatch Alarms from metrics
-- Create Alarms
+### Create Graph for Avg Node CPU Utlization
+- DashBoard Name: EKS-Performance
+- Widget Type: Bar
+- Log Group: /aws/containerinsights/eksdemo1/performance
+```
+STATS avg(node_cpu_utilization) as avg_node_cpu_utilization by NodeName
+| SORT avg_node_cpu_utilization DESC 
+```
+
+### Container Restarts
+- DashBoard Name: EKS-Performance
+- Widget Type: Table
+- Log Group: /aws/containerinsights/eksdemo1/performance
+```
+STATS avg(number_of_container_restarts) as avg_number_of_container_restarts by PodName
+| SORT avg_number_of_container_restarts DESC
+```
+
+### Cluster Node Failures
+- DashBoard Name: EKS-Performance
+- Widget Type: Table
+- Log Group: /aws/containerinsights/eksdemo1/performance
+```
+stats avg(cluster_failed_node_count) as CountOfNodeFailures 
+| filter Type="Cluster" 
+| sort @timestamp desc
+```
+### CPU Usage By Container
+- DashBoard Name: EKS-Performance
+- Widget Type: Bar
+- Log Group: /aws/containerinsights/eksdemo1/performance
+```
+stats pct(container_cpu_usage_total, 50) as CPUPercMedian by kubernetes.container_name 
+| filter Type="Container"
+```
 
+### Pods Requested vs Pods Running
+- DashBoard Name: EKS-Performance
+- Widget Type: Bar
+- Log Group: /aws/containerinsights/eksdemo1/performance
+```
+fields @timestamp, @message 
+| sort @timestamp desc 
+| filter Type="Pod" 
+| stats min(pod_number_of_containers) as requested, min(pod_number_of_running_containers) as running, ceil(avg(pod_number_of_containers-pod_number_of_running_containers)) as pods_missing by kubernetes.pod_name 
+| sort pods_missing desc
+```
+
+### Application log errors by container name
+- DashBoard Name: EKS-Performance
+- Widget Type: Bar
+- Log Group: /aws/containerinsights/eksdemo1/application
+```
+stats count() as countoferrors by kubernetes.container_name 
+| filter stream="stderr" 
+| sort countoferrors desc
+```
+
+- **Reference**: https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Container-Insights-view-metrics.html
+
+
+## Step-09: Container Insights - CloudWatch Alarms
+### Create Alarms - Node CPU Usage
+- **Specify metric and conditions**
+  - **Select Metric:** Container Insights -> ClusterName -> node_cpu_utilization
+  - **Metric Name:** eksdemo1_node_cpu_utilization
+  - **Threshold Value:** 4 
+  - **Important Note:** Anything above 4% of CPU it will send a notification email, ideally it should 80% or 90% CPU but we are giving 4% CPU just for load simulation testing 
+- **Configure Actions**
+  - **Create New Topic:** eks-alerts
+  - **Email:** dkalyanreddy@gmail.com
+  - Click on **Create Topic**
+  - **Important Note:**** Complete Email subscription sent to your email id.
+- **Add name and description**
+  - **Name:** EKS-Nodes-CPU-Alert
+  - **Descritption:** EKS Nodes CPU alert notification  
+  - Click Next
+- **Preview**
+  - Preview and Create Alarm
+- **Add Alarm to our custom Dashboard**
+- Generate Load & Verify Alarm
+```
+# Generate Load
+kubectl run --generator=run-pod/v1 apache-bench -i --tty --rm --image=httpd -- ab -n 500000 -c 1000 http://sample-nginx-service.default.svc.cluster.local/ 
+```
 
-## Step-09: Clean-Up Container Insights
+## Step-10: Clean-Up Container Insights
 ```
 # Template
 curl https://raw.githubusercontent.com/aws-samples/amazon-cloudwatch-container-insights/latest/k8s-deployment-manifest-templates/deployment-mode/daemonset/container-insights-monitoring/quickstart/cwagent-fluentd-quickstart.yaml | sed "s/{{cluster_name}}/cluster-name/;s/{{region_name}}/cluster-region/" | kubectl delete -f -
@@ -75,7 +162,7 @@ curl https://raw.githubusercontent.com/aws-samples/amazon-cloudwatch-container-i
 curl https://raw.githubusercontent.com/aws-samples/amazon-cloudwatch-container-insights/latest/k8s-deployment-manifest-templates/deployment-mode/daemonset/container-insights-monitoring/quickstart/cwagent-fluentd-quickstart.yaml | sed "s/{{cluster_name}}/eksdemo1/;s/{{region_name}}/us-east-1/" | kubectl delete -f -
 ```
 
-## Step-10: Clean-Up Application
+## Step-11: Clean-Up Application
 ```
 # Delete Apps
 kubectl delete -f  kube-manifests/