kernel: support gcc-optimized inlining on all architectures
authorFelix Fietkau <nbd@nbd.name>
Thu, 25 Jan 2018 13:01:34 +0000 (14:01 +0100)
committerJo-Philipp Wich <jo@mein.io>
Tue, 18 Dec 2018 16:22:04 +0000 (17:22 +0100)
Optimized inlining was disabled by default when gcc 4 was still
relatively new. By now, all gcc versions handle this well and there
seems to be no real reason to keep it x86-only.

Signed-off-by: Felix Fietkau <nbd@nbd.name>
(backported from 1e8882585c6f4a5e7f5e2b4f18cd550aafa6f81d)
(rebased patches)
Signed-off-by: Jo-Philipp Wich <jo@mein.io>
target/linux/generic/config-4.14
target/linux/generic/config-4.9
target/linux/generic/pending-4.14/220-optimize_inlining.patch [new file with mode: 0644]
target/linux/generic/pending-4.9/220-optimize_inlining.patch [new file with mode: 0644]
target/linux/generic/pending-4.9/890-uart_optional_sysrq.patch
target/linux/x86/config-4.14

index 96916c0e43e8ebd9a7ec8c4efcfa6a49bfcc9c2d..34773958f5ef2955ac6360d9c9909cb7db532129 100644 (file)
@@ -3312,6 +3312,7 @@ CONFIG_NMI_LOG_BUF_SHIFT=13
 # CONFIG_OPROFILE is not set
 # CONFIG_OPROFILE_EVENT_MULTIPLEX is not set
 # CONFIG_OPT3001 is not set
+# CONFIG_OPTIMIZE_INLINING is not set
 # CONFIG_ORANGEFS_FS is not set
 # CONFIG_ORION_WATCHDOG is not set
 # CONFIG_OSF_PARTITION is not set
index 53955d9ae7f331cd097ba0d9531af2b8af9b5e63..5e2b25f31e380b4f6aea114fe68f79ce99dc8d63 100644 (file)
@@ -3117,6 +3117,7 @@ CONFIG_NMI_LOG_BUF_SHIFT=13
 # CONFIG_OPROFILE is not set
 # CONFIG_OPROFILE_EVENT_MULTIPLEX is not set
 # CONFIG_OPT3001 is not set
+# CONFIG_OPTIMIZE_INLINING is not set
 # CONFIG_ORANGEFS_FS is not set
 # CONFIG_ORION_WATCHDOG is not set
 # CONFIG_OSF_PARTITION is not set
diff --git a/target/linux/generic/pending-4.14/220-optimize_inlining.patch b/target/linux/generic/pending-4.14/220-optimize_inlining.patch
new file mode 100644 (file)
index 0000000..dca1dcb
--- /dev/null
@@ -0,0 +1,70 @@
+--- a/arch/x86/Kconfig.debug
++++ b/arch/x86/Kconfig.debug
+@@ -284,20 +284,6 @@ config CPA_DEBUG
+       ---help---
+         Do change_page_attr() self-tests every 30 seconds.
+-config OPTIMIZE_INLINING
+-      bool "Allow gcc to uninline functions marked 'inline'"
+-      ---help---
+-        This option determines if the kernel forces gcc to inline the functions
+-        developers have marked 'inline'. Doing so takes away freedom from gcc to
+-        do what it thinks is best, which is desirable for the gcc 3.x series of
+-        compilers. The gcc 4.x series have a rewritten inlining algorithm and
+-        enabling this option will generate a smaller kernel there. Hopefully
+-        this algorithm is so good that allowing gcc 4.x and above to make the
+-        decision will become the default in the future. Until then this option
+-        is there to test gcc for this.
+-
+-        If unsure, say N.
+-
+ config DEBUG_ENTRY
+       bool "Debug low-level entry code"
+       depends on DEBUG_KERNEL
+--- a/lib/Kconfig.debug
++++ b/lib/Kconfig.debug
+@@ -137,6 +137,20 @@ endmenu # "printk and dmesg options"
+ menu "Compile-time checks and compiler options"
++config OPTIMIZE_INLINING
++      bool "Allow gcc to uninline functions marked 'inline'"
++      ---help---
++        This option determines if the kernel forces gcc to inline the functions
++        developers have marked 'inline'. Doing so takes away freedom from gcc to
++        do what it thinks is best, which is desirable for the gcc 3.x series of
++        compilers. The gcc 4.x series have a rewritten inlining algorithm and
++        enabling this option will generate a smaller kernel there. Hopefully
++        this algorithm is so good that allowing gcc 4.x and above to make the
++        decision will become the default in the future. Until then this option
++        is there to test gcc for this.
++
++        If unsure, say N.
++
+ config DEBUG_INFO
+       bool "Compile the kernel with debug info"
+       depends on DEBUG_KERNEL && !COMPILE_TEST
+--- a/arch/x86/Kconfig
++++ b/arch/x86/Kconfig
+@@ -296,9 +296,6 @@ config ZONE_DMA32
+ config AUDIT_ARCH
+       def_bool y if X86_64
+-config ARCH_SUPPORTS_OPTIMIZED_INLINING
+-      def_bool y
+-
+ config ARCH_SUPPORTS_DEBUG_PAGEALLOC
+       def_bool y
+--- a/include/linux/compiler-gcc.h
++++ b/include/linux/compiler-gcc.h
+@@ -90,8 +90,7 @@
+  * of extern inline functions at link time.
+  * A lot of inline functions can cause havoc with function tracing.
+  */
+-#if !defined(CONFIG_ARCH_SUPPORTS_OPTIMIZED_INLINING) ||              \
+-    !defined(CONFIG_OPTIMIZE_INLINING) || (__GNUC__ < 4)
++#if !defined(CONFIG_OPTIMIZE_INLINING) || (__GNUC__ < 4)
+ #define inline \
+       inline __attribute__((always_inline, unused)) notrace __gnu_inline
+ #else
diff --git a/target/linux/generic/pending-4.9/220-optimize_inlining.patch b/target/linux/generic/pending-4.9/220-optimize_inlining.patch
new file mode 100644 (file)
index 0000000..75c04ea
--- /dev/null
@@ -0,0 +1,70 @@
+--- a/arch/x86/Kconfig.debug
++++ b/arch/x86/Kconfig.debug
+@@ -287,20 +287,6 @@ config CPA_DEBUG
+       ---help---
+         Do change_page_attr() self-tests every 30 seconds.
+-config OPTIMIZE_INLINING
+-      bool "Allow gcc to uninline functions marked 'inline'"
+-      ---help---
+-        This option determines if the kernel forces gcc to inline the functions
+-        developers have marked 'inline'. Doing so takes away freedom from gcc to
+-        do what it thinks is best, which is desirable for the gcc 3.x series of
+-        compilers. The gcc 4.x series have a rewritten inlining algorithm and
+-        enabling this option will generate a smaller kernel there. Hopefully
+-        this algorithm is so good that allowing gcc 4.x and above to make the
+-        decision will become the default in the future. Until then this option
+-        is there to test gcc for this.
+-
+-        If unsure, say N.
+-
+ config DEBUG_ENTRY
+       bool "Debug low-level entry code"
+       depends on DEBUG_KERNEL
+--- a/lib/Kconfig.debug
++++ b/lib/Kconfig.debug
+@@ -117,6 +117,20 @@ endmenu # "printk and dmesg options"
+ menu "Compile-time checks and compiler options"
++config OPTIMIZE_INLINING
++      bool "Allow gcc to uninline functions marked 'inline'"
++      ---help---
++        This option determines if the kernel forces gcc to inline the functions
++        developers have marked 'inline'. Doing so takes away freedom from gcc to
++        do what it thinks is best, which is desirable for the gcc 3.x series of
++        compilers. The gcc 4.x series have a rewritten inlining algorithm and
++        enabling this option will generate a smaller kernel there. Hopefully
++        this algorithm is so good that allowing gcc 4.x and above to make the
++        decision will become the default in the future. Until then this option
++        is there to test gcc for this.
++
++        If unsure, say N.
++
+ config DEBUG_INFO
+       bool "Compile the kernel with debug info"
+       depends on DEBUG_KERNEL && !COMPILE_TEST
+--- a/arch/x86/Kconfig
++++ b/arch/x86/Kconfig
+@@ -273,9 +273,6 @@ config ZONE_DMA32
+ config AUDIT_ARCH
+       def_bool y if X86_64
+-config ARCH_SUPPORTS_OPTIMIZED_INLINING
+-      def_bool y
+-
+ config ARCH_SUPPORTS_DEBUG_PAGEALLOC
+       def_bool y
+--- a/include/linux/compiler-gcc.h
++++ b/include/linux/compiler-gcc.h
+@@ -89,8 +89,7 @@
+  * of extern inline functions at link time.
+  * A lot of inline functions can cause havoc with function tracing.
+  */
+-#if !defined(CONFIG_ARCH_SUPPORTS_OPTIMIZED_INLINING) ||              \
+-    !defined(CONFIG_OPTIMIZE_INLINING) || (__GNUC__ < 4)
++#if !defined(CONFIG_OPTIMIZE_INLINING) || (__GNUC__ < 4)
+ #define inline \
+       inline __attribute__((always_inline, unused)) notrace __gnu_inline
+ #else
index ff0824d343d07cfcdd102b1562b067e0adde778c..d80246db99ff0a4f64b2902cfa28b1693f579173 100644 (file)
@@ -26,7 +26,7 @@ Signed-off-by: Felix Fietkau <nbd@nbd.name>
  {
 --- a/lib/Kconfig.debug
 +++ b/lib/Kconfig.debug
-@@ -396,6 +396,11 @@ config MAGIC_SYSRQ_DEFAULT_ENABLE
+@@ -410,6 +410,11 @@ config MAGIC_SYSRQ_DEFAULT_ENABLE
          This may be set to 1 or 0 to enable or disable them all, or
          to a bitmask as described in Documentation/sysrq.txt.
  
index 038d874e52154ea7e0e91470fb12215f77202570..4a81cbc6b868a96b87c4704516dec552601c03e1 100644 (file)
@@ -350,7 +350,6 @@ CONFIG_NVRAM=y
 CONFIG_OLD_SIGACTION=y
 CONFIG_OLD_SIGSUSPEND3=y
 CONFIG_OPROFILE_NMI_TIMER=y
-# CONFIG_OPTIMIZE_INLINING is not set
 CONFIG_OUTPUT_FORMAT="elf32-i386"
 CONFIG_PAGE_OFFSET=0xC0000000
 CONFIG_PC104=y